Text to speech android что это
Краткое описание:
Синтезатор речи Google.
Описание:
Синтезатор речи Google озвучивает текст, который виден на экране устройства. Где это может пригодиться?
• В Google Play Книгах можно пользоваться функцией «Чтение вслух».
• В Google Переводчике можно слушать произношение слов.
• При использовании TalkBack и других специальных возможностей озвучиваются ваши действия.
• Также в Play Маркете есть много других приложений, в которых применяется синтез речи.
Функция доступна на следующих языках: английский (Австралия, Великобритания, Индия, США), бенгальский (Бангладеш), венгерский, датский, индонезийский, испанский (Испания, США), итальянский, кантонский (Гонконг), корейский, мандаринский (Китай, Тайвань), немецкий, нидерландский, норвежский, польский, португальский (Бразилия), русский, тайский, турецкий, финский, французский, хинди и японский.
- Устанавливаем программу (из Play Market-a или через apk)
- Открываем программу «Настройки»
- Ищем пункт меню «Синтез речи» или «Преобразование текста в речь» . Названия отличаются в зависимости от версии Android, а также от оболочки устройства (например, настройки Xiaomi отличаются от настроек Samsung).
- В пункте «Синтезатор по умолчанию/Предпочитаемый модуль/Система по умолчанию» (названия также отличаются от версии Android и оболочки устройства) выбираем нужный нам синтезатор речи
- Далее заходим в настройки синтезатора и выбираем параметры
Синтезатор готов к использованию
- Открываем электронную книгу, которую мы хотим озвучить, в любой программе-читалке (например, moon reader)
- Воспроизводим наш текст
Синтезатор речи Google читает только тогда, когда приложение позволяет сделать это.
Если браузер не поддерживает функцию запуска текста в речь, то и воспроизводиться ничего не будет.Если хотите, чтобы браузер озвучивал выделенный текст, скачайте Яндекс браузер. Там есть такая функция
Как установить голосовой пакет вручную?
1. Скачать голосовой пакет (это zip-архив).
2. Извлечь содержимое архива в папку /data/data/com.google.android.tts/ . Для доступа к этой папке необходимы права root.Как скачать голосовой пакет вручную?
В настоящее время адрес для скачивания языкового пакета (например, для русского языка) выглядит следующим образом https :// redirector.gvt1.com/edgedl/android/tts/v15/ru-ru-x-dfc-r.zvoice , где — это номер ревизии языкового пакета. Номер последней ревизии русского языкового пакета 41 . В дальнейшем (с выходом новых версий TTS) номер ревизии может увеличиваться (42, 43, . ). Адрес для скачивания также может измениться, начиная с какой-то новой версии. Скачанный файл, независимо от его расширения, является zip-архивом. English (GB):
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-gb-x-rjs-r 43 .zvoice
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-gb-x-fis-r 43 .zvoiceEnglish (US):
https :// redirector.gvt1.com/edgedl/android/tts/v15/en-us-x-sfg-r 45 .zvoiceDeutsch:
https :// redirector.gvt1.com/edgedl/android/tts/v15/de-de-x-nfh-r 41 .zvoiceFrançais:
https :// redirector.gvt1.com/edgedl/android/tts/v15/fr-fr-x-vlf-r 42 .zvoiceEspañol:
https :// redirector.gvt1.com/edgedl/android/tts/v15/es-es-x-ana-r 40 .zvoice
https :// redirector.gvt1.com/edgedl/android/tts/v15/es-us-x-sfb-r 42 .zvoiceУкраїнська:
https :// redirector.gvt1.com/edgedl/android/tts/v15/uk-ua-x-hfd-r 9 .zvoiceСкачать: ˇ
Версия: googletts.google-speech-apk_20211101.01_p3.409287195 Google Play от 22/11/2021 (vladmira)
Версия: googletts.google-speech-apk_20211021.01_p2.407135529 Google Play от 16/11/2021 (vladmira)
Версия: googletts.google-speech-apk_20211021.01_p1.405680002 (4 variants) от Google Play Market (gorand39)
Версия: googletts.google-speech-apk_20210914.01_p5.401064153 Google Play от 02/11/2021 (vladmira)
Версия: googletts.google-speech-apk_20210914.01_p4.398601325 Google Play от 23/09/2021 (vladmira)Версия: 3.20.6.280280128 (All): Google Text-to-Speech (Синтезатор речи Google) (Пост iMiKED #91102147)
версия 3.19.17.270646921 (All): Google Text-to-Speech (Синтезатор речи Google) (Пост #89414433)
версия 3.19.16.270163878 (arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #89187738)
версия 3.18.14.261387622 (arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #87727923)
версия 3.18.13.260303084 (arm / arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #87584412)
версия 3.18.9.259456454 (arm / arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #87385738)
версия 3.17.4.244699203 (arm / arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #85515734)
Требуется Android: 4.0.3+ / 4.4+ (версии NEON)
версия 3.15.18.200023596: Google Text-to-Speech (Синтезатор речи Google) (Пост #74145208)
версия 3.15.17 (arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #73983262)
версия 3.14.12 (х86): Google Text-to-Speech (Синтезатор речи Google) (Пост #71271601)
версия 3.14.9 (arm NEON / х86): Google Text-to-Speech (Синтезатор речи Google) (Пост #68825031)
версия 3.14.7 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #67805151)
версия 3.14.6 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #67774008)
версия 3.13.3 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #66083564)
версия 3.13.2 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #65379722)
версия 3.12.9 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #63509245)
версия 3.12.8 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #63043156)
версия 3.12.2 (arm NEON)(8.0+): Google Text-to-Speech (Синтезатор речи Google) (Пост #61587537)
версия 3.11.12 (x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #60176689)
версия 3.13.3 (х86): Google Text-to-Speech (Синтезатор речи Google) (Пост алекс12 #66130177)
версия 3.11.12 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60176689)
версия 3.11.11 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60078544)
версия 3.11.10 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60011739)
версия 3.10.10 (x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #53996581)
версия 3.10.10 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #53750543)
версия 3.10.9 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #53624469)
версия 3.10.9 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост onkolog #54031480)
версия 3.9.14 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #50474547)
версия 3.9.11 (x86):com.google.android.tts_3.9.11_x86.apk ( 13.56 МБ )
версия 3.9.11 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49869119)
версия 3.9.11 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #49947229)
версия 3.9.6 mod: Google Text-to-Speech (Синтезатор речи Google) (Пост #49816808)
версия 3.9.6 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49779491)
версия 3.8.17 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49830320)
версия 3.8.16 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #47954663)
версия 3.8.16 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #48232188)
версия 3.8.16 (x86):com.google.android.tts_3.8.16_x86.apk ( 13.39 МБ )
версия 3.8.14 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #47207737)
версия 3.8.14 (arm + x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #47211873)
версия 3.8.13 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #47007743)
версия 3.8.11 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #46813869)
версия 3.7.12.2235583.arm.arm_neon: Google Text-to-Speech (Синтезатор речи Google) (Пост #42962600)
версии 3.5.6 — 3.7.12 ( Mod ): Google Text-to-Speech (Синтезатор речи Google) (Пост #41685110)
версия 3.7.12.2235583.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.7.12.2235583.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #43152607)
версия 3.5.6.2080558.arm.neon: Google Text-to-Speech (Синтезатор речи Google) (Пост #41509182)
версия 3.5.6.2080558.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.5.5.2050975.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.4.6.1819666.arm ( Mod ): Google Text-to-Speech (Синтезатор речи Google) (Пост #39607460)
версия 3.4.6.1819666.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #41207944)
версия 3.4.5.1772910.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #38792138)
версия 3.4.5.1772910: Google Text-to-Speech (Синтезатор речи Google) (Пост #38792138)
версия 3.3.13.1635260.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #36434603)
версия 3.3.12.1616444: Google Text-to-Speech (Синтезатор речи Google) (Пост #36222401)
версия 3.2.12.1369973: Google Text-to-Speech (Синтезатор речи Google) (Пост #34162389)
версия 3.1.3.1162895:com.google.android.tts_3.1.3.1162895.apk ( 13.04 МБ )
Источник
Обзор мобильных Text-To-Speech движков
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Для удобства разделим движки TTS на три класса:
- коммерческие;
- свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
- встроенные (средства, предоставляемые самой операционной системой).
Коммерческие движки
SVOX Mobile TTS
Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: естьКомпания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.
Acapela TTS
Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: естьСотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.
Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.
Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.
Loquendo Embedded TTS
Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: естьДвижок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.
Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.
Sakrament TTS
Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: естьКачества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.
Свободные движки
Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.
eSpeak
Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.
eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.
Встроенные решения
Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian
Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: естьВстроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.
Android
Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: естьВстроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.
Заключение
Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.
Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.
Источник