SBM Model

Данный проект был создан за один вечер мной и Клодом для проверки работоспособности идеи. Главная ценность проекта это датасет, который создаётся вручную.

Возможности

обработка WAV, MP3, OGG и FLAC
обучение модели по JSON-файлу с парами аудио
кеширование аудиопризнаков в data/cache/
сохранение текущей модели в out/sbm.model.npz
сохранение копий моделей и JSON-метаданных в history/
проверка пары напев + песня из командной строки

Установка

python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

Для MP3/OGG/FLAC нужен FFmpeg:

brew install ffmpeg

Формат JSON

JSON должен быть списком пар:

[
  {
    "id": "example_1",
    "humming_path": "audio/humming/example.wav",
    "song_path": "audio/song/song.wav",
    "label": 1
  }
]

Пути могут быть абсолютными или относительными от папки, где лежит JSON. label = 1 означает совпадение, label = 0 означает несовпадение.

Обучение

python3 main.py train data/chant/generated/train.json

С отдельной валидацией:

python3 main.py train data/chant/generated/train.json --val-json data/chant/generated/val.json

Параметры:

python3 main.py train data/chant/generated/train.json \
  --epochs 500 \
  --batch-size 16 \
  --lr 0.02

Отключить кеш:

python3 main.py train data/chant/generated/train.json --no-cache

После обучения создаются:

out/sbm.model.npz - текущая модель
history/model_YYYY-MM-DD_HH-MM-SS.npz - копия модели
history/model_YYYY-MM-DD_HH-MM-SS.json - метаданные обучения

Проверка пары

python3 main.py predict \
  --humming path/to/humming.wav \
  --song path/to/song.mp3

С явным путём к модели:

python3 main.py predict \
  --model history/model_2026-06-18_10-00-00.npz \
  --humming path/to/humming.wav \
  --song path/to/song.mp3

Информация о модели

python3 main.py info

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
app		app
data		data
out		out
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SBM Model

Возможности

Установка

Формат JSON

Обучение

Проверка пары

Информация о модели

About

Uh oh!

Releases

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SBM Model

Возможности

Установка

Формат JSON

Обучение

Проверка пары

Информация о модели

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Contributors

Uh oh!

Languages