Сравнение оффлайн и облачной транскрибации: стоимость, приватность и качество расшифровки аудио. Почему локальная транскрибация на Mac выгоднее.
Traart навсегда
vs $96-1728/год у облака
WER на русском
SOTA (INTERSPEECH 2025)
байт в облако
100% локальная обработка
ограничений
без лимитов и подписок
Актуальные тарифы облачных сервисов на февраль 2026. Расчет для типичного объема: 20 часов аудио в месяц.
| Сервис | Тип | Цена / мин | Цена / час | 20 час/мес | 240 час/год | Free tier |
|---|---|---|---|---|---|---|
| Traart | Оффлайн | $0 | $0 | $0 | $0 | Безлимит |
| AWS Transcribe | Облако | $0.024 | $1.44 | $28.80 | $345.60 | 60 мин/мес (12 мес) |
| Google STT v2 | Облако | $0.016 | $0.96 | $19.20 | $230.40 | 60 мин/мес |
| Azure Speech | Облако | $0.017 | $1.00 | $20.00 | $240.00 | 5 час/мес |
| Yandex SpeechKit | Облако | $0.005 | $0.32 | $6.40 | $76.80 | Пробные кредиты |
| TurboScribe | Облако | подписка | подписка | $10/мес | $120.00 | 3 файла/день |
| Notta Pro | Облако | подписка | подписка | $8.17/мес | $98.00 | 120 мин/мес (3 мин/запись) |
| Otter.ai Pro | Облако | подписка | подписка | $8.33/мес | $100.00 | 300 мин/мес (нет русского) |
Цены актуальны на февраль 2026. Источники: официальные страницы тарифов каждого сервиса. Подписки указаны при годовой оплате.
Реальная стоимость облака выше заявленной. Вот что обычно не учитывают.
AWS, Google, Azure берут отдельно за хранение (S3, GCS), вычисления (Lambda, Functions), сетевой трафик. Azure Speech $1/час превращается в $1.50+ с учетом экосистемы.
Диаризация у AWS -- +$0.002/мин. Enhanced-модели Google -- $0.036/мин (+125%). Custom vocabulary Azure -- $1.20/час (+20%). Каждая фича увеличивает счет.
Google/AWS/Azure требуют 30-45 минут на настройку: аккаунт, IAM, API-ключи, биллинг. Traart: перетащить .dmg в Applications -- готово.
Перейти с AWS на Google или Azure -- переписать код. С Traart переходить некуда не нужно: данные на вашем диске, формат открытый (MD, TXT, JSON).
AWS берет минимум 15 секунд за запрос. Короткий 3-секундный фрагмент стоит как 15-секундный. У Traart ограничений нет.
Нет Wi-Fi -- нет транскрибации. В самолете, поезде, за городом облачные сервисы бесполезны. Traart работает полностью автономно.
Голосовые данные -- это биометрия. Каждый облачный сервис обрабатывает их по-разному.
| Параметр | Traart | Google STT | Azure Speech | AWS Transcribe | Yandex |
|---|---|---|---|---|---|
| Где данные | Ваш Mac | US / EU серверы | US / EU серверы | US серверы | РФ серверы |
| Передача аудио | Нет (0 байт) | Да (TLS) | Да (TLS) | Да (TLS) | Да (TLS) |
| 152-ФЗ | Полностью | ||||
| GDPR | Не применимо | Data Processing Agreement | Data Processing Agreement | Data Processing Agreement | Свое соглашение |
| Обучение AI на данных | Невозможно | Opt-out доступен | Opt-out доступен | Не используют | Не раскрыто |
| Регистрация | Не нужна | Google Cloud аккаунт | Azure аккаунт | AWS аккаунт | Yandex Cloud аккаунт |
| Риск утечки | Нулевой | Серверная атака | Серверная атака | Серверная атака | Серверная атака |
Голос -- биометрические данные. По GDPR (ст. 9) и 152-ФЗ голосовые данные относятся к биометрическим персональным данным. Их обработка требует явного согласия субъекта.
Штрафы GDPR: до 20 млн EUR или 4% глобального оборота за нарушение обработки биометрических данных.
Notta обучает AI на данных. Notta в условиях использования раскрывает, что данные пользователей могут использоваться для обучения моделей. Enterprise-план исключает это, но стоит значительно дороже.
Решение Traart: данные не покидают Mac. Архитектура не имеет сетевых вызовов. Физически невозможно передать аудио куда-либо.
Word Error Rate (WER) -- процент ошибочных слов. Меньше = лучше.
WER GigaAM v3 и Whisper: arXiv:2506.01192 (INTERSPEECH 2025). Облачные API: оценки на аналогичных датасетах.
Облачные сервисы vs оффлайн-решение: что вы получаете и чего лишаетесь.
| Возможность | Traart (оффлайн) | Облачные API | Облачные SaaS |
|---|---|---|---|
| Работа без интернета | |||
| Приватность (0 передачи) | |||
| Без регистрации | |||
| Диаризация бесплатно | Доплата | Не везде | |
| Автомониторинг папок | |||
| GUI (без кода) | |||
| Потоковое распознавание | |||
| 100+ языков | |||
| SOTA русский (WER 8.3%) |
Адвокатская тайна не совместима с передачей записей в облако. Облачный сервис -- это третье лицо с доступом к конфиденциальной информации клиента.
Врачебная тайна и персональные данные пациентов. Передача медицинских записей в облако создает риски нарушения 323-ФЗ и HIPAA.
Защита источников -- базовый принцип журналистской этики. Облачная транскрибация создает цифровой след, который может быть запрошен по суду.
Записи совещаний, стратегических сессий, переговоров -- коммерческая тайна. Один инцидент у AI-notetaker Novacy уже привел к потере данных клиентов.
152-ФЗ требует хранения персональных данных граждан РФ на территории России. Передача на серверы Google/AWS/Azure -- прямое нарушение.
Этические комитеты университетов требуют информированного согласия при обработке аудиоданных. Оффлайн-обработка значительно упрощает compliance.
Облачные сервисы имеют свои преимущества. Вот когда они предпочтительнее:
Если нужна транскрибация в реальном времени (live-субтитры, call-центр), облачные API -- единственный вариант. Traart обрабатывает файлы post-factum.
Google STT поддерживает 125+ языков, AWS -- 100+. Traart специализируется на русском языке.
Обработка тысяч часов аудио в месяц эффективнее в облаке с автоматическим масштабированием ресурсов.
API-сервисы легко интегрируются в существующие системы: CRM, аналитика, мониторинг качества.
Стоимость: Облачные сервисы обойдутся в $77-346 за год при 20 часах аудио в месяц. Traart -- $0 навсегда, без лимитов.
Качество: WER 8.3% (GigaAM v3, INTERSPEECH 2025) -- лучше Google STT (16.7%), в 2x лучше Whisper-сервисов (~16%).
Приватность: Ни один байт аудио не покидает Mac. Соответствие 152-ФЗ и GDPR гарантировано архитектурой приложения.