Traart vs VOSK

Оба open-source, оба оффлайн, оба бесплатные. Разница — в качестве модели и в готовности к работе: VOSK требует кода, Traart — двойной клик.

VOSK даёт ~25% WER, Traart — 8.3% на том же русском

VOSK — старая, проверенная open-source библиотека от alphacephei.com. Её русские модели дают ~25% WER (то есть каждое 4-е слово примерно искажается). Traart использует GigaAM v3 от Сбера — модель 2025 года с WER 8.3% (~3 раза точнее).


В этой статье
~ мин чтения

    Сравнение по пунктам

    Traart VOSK
    Цена Бесплатно Бесплатно
    WER на русском 8.3% (GigaAM v3) ~25% (legacy модель)
    Лицензия MIT Apache 2.0
    Готовность к работе DMG → двойной клик Python/код
    Интерфейс на macOS Menu bar app CLI / библиотека
    Apple Silicon (MPS) CPU only
    Скорость на часе аудио 2-3 минуты 10-20 минут
    Диаризация спикеров pyannote 3.1
    Streaming (живой звук)
    Автомониторинг папок

    Когда Traart лучше VOSK

    Точность ~3× выше

    VOSK на русских моделях даёт WER ~25% — это очень посредственно для серьёзной транскрибации. GigaAM v3 в Traart — 8.3%. Разница чувствительна сразу: меньше ручных правок, точнее имена, цифры, термины.

    Готовый Mac-интерфейс

    VOSK — это библиотека для разработчика. Чтобы транскрибировать аудио, нужно писать Python-скрипт, ставить модель, обрабатывать форматы. Traart — обычное Mac-приложение: установил, бросил файл в папку, получил .txt.

    Apple Silicon ускорение

    VOSK работает только на CPU — час аудио займёт 10-20 минут. Traart использует MPS на Apple Silicon — те же 10 минут аудио обрабатывается за минуту-две.

    Диаризация из коробки

    VOSK не разделяет говорящих — на интервью с двумя людьми будет один сплошной текст. Traart автоматически делит реплики через pyannote 3.1: «Спикер 1 / Спикер 2».


    Когда VOSK подойдёт лучше

    VOSK — правильный выбор в этих сценариях:

    Streaming (живая транскрибация)

    VOSK поддерживает потоковое распознавание из микрофона. Если нужно живое транскрибирование речи в реальном времени (диктовка, субтитры на лету) — Traart пока такого не умеет.

    Linux / Windows / Android

    VOSK кросс-платформенен и работает на Linux, Windows, Android, Raspberry Pi. Traart — только macOS на Apple Silicon.

    Встроить в свой код

    Если вы разработчик и нужно встроить ASR в свой backend / десктоп-приложение — VOSK даёт удобную Python/Java/C# API. Traart — конечный продукт без публичного SDK.

    Минимум памяти

    VOSK-модели бывают «small» — буквально 50 МБ. Если нужно крутить ASR на слабой машине или embedded — VOSK хорош. GigaAM v3 — полтора гигабайта.


    Вердикт

    Для конечного пользователя на Mac — Traart выигрывает по всем фронтам. Точность ~3× выше (8.3% vs 25%), не нужно писать код, есть диаризация, ускорение на Apple Silicon, готовое DMG.

    VOSK по-прежнему хорош как библиотека для разработчиков, для streaming-кейсов и для работы на Linux/embedded. Но для повседневной транскрибации на Mac — Traart.

    Скачать Traart бесплатно macOS 13+ / Apple Silicon / ~2 ГБ

    Смотрите также


    Точность 8.3% против 25% — это Traart

    Готовый Mac-интерфейс, MPS-ускорение, диаризация. Скачайте Traart.

    Скачать бесплатно

    Автор Traart — , разработчик и автор open-source-проектов в области распознавания русской речи. Подробнее →