Traart vs VOSK

Оба open-source, оба оффлайн, оба бесплатные. Разница — в качестве модели и в готовности к работе: VOSK требует кода, Traart — двойной клик.

VOSK даёт ~25% WER, Traart — 8.3% на том же русском

VOSK — старая, проверенная open-source библиотека от alphacephei.com. Её русские модели дают ~25% WER (то есть каждое 4-е слово примерно искажается). Traart использует GigaAM v3 от Сбера — модель 2025 года с WER 8.3% (~3 раза точнее).


В этой статье
~ мин

Сравнение по пунктам

Traart VOSK
Цена Бесплатно Бесплатно
WER на русском 8.3% (GigaAM v3) ~25% (legacy модель)
Лицензия MIT Apache 2.0
Готовность к работе DMG → двойной клик Python/код
Интерфейс на macOS Menu bar app CLI / библиотека
Apple Silicon (MPS) CPU only
Скорость на часе аудио 2-3 минуты 10-20 минут
Диаризация спикеров pyannote 3.1
Streaming (живой звук)
Автомониторинг папок

Когда Traart лучше VOSK

Точность ~3× выше

VOSK на русских моделях даёт WER ~25% — это очень посредственно для серьёзной транскрибации. GigaAM v3 в Traart — 8.3%. Разница чувствительна сразу: меньше ручных правок, точнее имена, цифры, термины.

Готовый Mac-интерфейс

VOSK — это библиотека для разработчика. Чтобы транскрибировать аудио, нужно писать Python-скрипт, ставить модель, обрабатывать форматы. Traart — обычное Mac-приложение: установил, бросил файл в папку, получил .txt.

Apple Silicon ускорение

VOSK работает только на CPU — час аудио займёт 10-20 минут. Traart использует MPS на Apple Silicon — те же 10 минут аудио обрабатывается за минуту-две.

Диаризация из коробки

VOSK не разделяет говорящих — на интервью с двумя людьми будет один сплошной текст. Traart автоматически делит реплики через pyannote 3.1: «Спикер 1 / Спикер 2».


Когда VOSK подойдёт лучше

VOSK — правильный выбор в этих сценариях:

Streaming (живая транскрибация)

VOSK поддерживает потоковое распознавание из микрофона. Если нужно живое транскрибирование речи в реальном времени (диктовка, субтитры на лету) — Traart пока такого не умеет.

Linux / Windows / Android

VOSK кросс-платформенен и работает на Linux, Windows, Android, Raspberry Pi. Traart — только macOS на Apple Silicon.

Встроить в свой код

Если вы разработчик и нужно встроить ASR в свой backend / десктоп-приложение — VOSK даёт удобную Python/Java/C# API. Traart — конечный продукт без публичного SDK.

Минимум памяти

VOSK-модели бывают «small» — буквально 50 МБ. Если нужно крутить ASR на слабой машине или embedded — VOSK хорош. GigaAM v3 — полтора гигабайта.


Вердикт

Для конечного пользователя на Mac — Traart выигрывает по всем фронтам. Точность ~3× выше (8.3% vs 25%), не нужно писать код, есть диаризация, ускорение на Apple Silicon, готовое DMG.

VOSK по-прежнему хорош как библиотека для разработчиков, для streaming-кейсов и для работы на Linux/embedded. Но для повседневной транскрибации на Mac — Traart.

Скачать Traart бесплатно macOS 13+ / Apple Silicon / ~2 ГБ

Смотрите также


Точность 8.3% против 25% — это Traart

Готовый Mac-интерфейс, MPS-ускорение, диаризация. Скачайте Traart.

Скачать бесплатно

Автор Traart — , разработчик и автор open-source-проектов в области распознавания русской речи. Подробнее →