Оба open-source, оба оффлайн, оба бесплатные. Разница — в качестве модели и в готовности к работе: VOSK требует кода, Traart — двойной клик.
VOSK — старая, проверенная open-source библиотека от alphacephei.com. Её русские модели дают ~25% WER (то есть каждое 4-е слово примерно искажается). Traart использует GigaAM v3 от Сбера — модель 2025 года с WER 8.3% (~3 раза точнее).
| Traart | VOSK | |
|---|---|---|
| Цена | Бесплатно | Бесплатно |
| WER на русском | 8.3% (GigaAM v3) | ~25% (legacy модель) |
| Лицензия | MIT | Apache 2.0 |
| Готовность к работе | DMG → двойной клик | Python/код |
| Интерфейс на macOS | Menu bar app | CLI / библиотека |
| Apple Silicon (MPS) | CPU only | |
| Скорость на часе аудио | 2-3 минуты | 10-20 минут |
| Диаризация спикеров | pyannote 3.1 | |
| Streaming (живой звук) | ||
| Автомониторинг папок |
VOSK на русских моделях даёт WER ~25% — это очень посредственно для серьёзной транскрибации. GigaAM v3 в Traart — 8.3%. Разница чувствительна сразу: меньше ручных правок, точнее имена, цифры, термины.
VOSK — это библиотека для разработчика. Чтобы транскрибировать аудио, нужно писать Python-скрипт, ставить модель, обрабатывать форматы. Traart — обычное Mac-приложение: установил, бросил файл в папку, получил .txt.
VOSK работает только на CPU — час аудио займёт 10-20 минут. Traart использует MPS на Apple Silicon — те же 10 минут аудио обрабатывается за минуту-две.
VOSK не разделяет говорящих — на интервью с двумя людьми будет один сплошной текст. Traart автоматически делит реплики через pyannote 3.1: «Спикер 1 / Спикер 2».
VOSK — правильный выбор в этих сценариях:
VOSK поддерживает потоковое распознавание из микрофона. Если нужно живое транскрибирование речи в реальном времени (диктовка, субтитры на лету) — Traart пока такого не умеет.
VOSK кросс-платформенен и работает на Linux, Windows, Android, Raspberry Pi. Traart — только macOS на Apple Silicon.
Если вы разработчик и нужно встроить ASR в свой backend / десктоп-приложение — VOSK даёт удобную Python/Java/C# API. Traart — конечный продукт без публичного SDK.
VOSK-модели бывают «small» — буквально 50 МБ. Если нужно крутить ASR на слабой машине или embedded — VOSK хорош. GigaAM v3 — полтора гигабайта.
Для конечного пользователя на Mac — Traart выигрывает по всем фронтам. Точность ~3× выше (8.3% vs 25%), не нужно писать код, есть диаризация, ускорение на Apple Silicon, готовое DMG.
VOSK по-прежнему хорош как библиотека для разработчиков, для streaming-кейсов и для работы на Linux/embedded. Но для повседневной транскрибации на Mac — Traart.
Готовый Mac-интерфейс, MPS-ускорение, диаризация. Скачайте Traart.
Скачать бесплатноАвтор Traart — Александр Куроглo, разработчик и автор open-source-проектов в области распознавания русской речи. Подробнее →