Распознавание речи · ASR · STT

Голос в текст за минуту

Перевод голоса в текст бесплатно и полностью оффлайн на macOS: совещания, диктовка, голосовые, интервью, лекции. На борту GigaAM v3 (RNNT, WER 8.3%) — лучшая модель распознавания русской речи. Без облака, без лимитов, без подписок.

Когда нужно перевести голос в текст

Текст ищется и копируется, голос — нет. Traart переводит голос в текст для любого аудиоисточника: совещания, диктовка, голосовые, интервью, лекции.

Диктовка вместо набора

Запишите мысли голосом, получите текст. 5 минут диктовки = 30 секунд распознавания. Подходит для черновиков статей, заметок, писем.

Совещания и созвоны

Запись Zoom, Google Meet, Telegram-кружка. Голос всех участников — в текст с таймкодами и разделением спикеров (диаризация).

Голосовые и интервью

Голосовые из Telegram/WhatsApp, диктофон iPhone, интервью под NDA. Распознавание речи происходит локально — данные не уходят в облако.

Как Traart переводит голос в текст

Перетащите аудио в окно

Любой файл с голосом: запись совещания, диктофон, голосовое, OGG из Telegram, MP4 с YouTube. Traart сам извлечёт аудио из видео.

Распознавание ASR на Apple Silicon

GigaAM v3 (RNNT-архитектура) распознаёт русскую речь локально. Минута голоса → 5-10 секунд работы на M1/M2/M3. Никакого интернета, никакой загрузки в облако.

Текст готов — копируйте, экспортируйте

Готовый текст в окне приложения. Скопируйте, экспортируйте в TXT, Markdown или JSON. С диаризацией — спикер 1/2/3, таймкоды.

Поддерживаемые форматы

Traart переводит голос в текст из любого аудио- и видеоформата — от голосовых OGG до записи видеосовещаний MP4.

OGG

OPUS

M4A

Voice Memos

MP3

Универсальный

WAV

Без сжатия

MP4

Видеосообщения

Почему оффлайн-распознавание речи лучше

Приватность по умолчанию

Запись совещания, интервью под NDA, голосовое личного характера — ничего не уходит в Yandex SpeechKit, SaluteSpeech, Google STT или Whisper API. Распознавание речи происходит на вашем Mac.

Скорость без аплоада

Нет задержки на загрузку файла в облако. Минута голоса в текст — за 5-10 секунд на Apple Silicon. Час совещания — 5-7 минут.

Без лимитов по минутам

Онлайн-сервисы ограничивают фритир: 30 минут — 5 часов в месяц, дальше $10–96/мес. Traart переводит голос в текст без счёта за минуты.

Точность для русского — 8.3% WER

GigaAM v3 от Сбера обучена на русском корпусе. Whisper-large-v3 даёт ~25% WER на русском — в 3 раза больше ошибок. Это значит меньше ручной правки текста после распознавания.