- Экранный диктор для Андроид или смартфон для слабовидящего или незрячего человека
- Классификация приложений
- Русскоязычные синтезаторы речи
- Acapela TTS Voices
- SVOX Classic TTS
- ESpeak
- Настройка TTS
- Использование экранного диктора TalkBack
- Управление Android-устройством с помощью TalkBack
- Видео: Acapela Tts Voices для Android
- Заключение
- Обзор синтезаторов речи для Андроид
- Синтез речи от Google
- Acapela TTS Voices
- Обзор мобильных Text-To-Speech движков
- Коммерческие движки
- Свободные движки
- Встроенные решения
- Заключение
Экранный диктор для Андроид или смартфон для слабовидящего или незрячего человека
Современный мир постоянно прогрессирует. Выпустился замечательный программный продукт — экранный диктор, благодаря которому человек лишенный зрения может окунуться в мир высоких технологий. Ранее мы писали про компьютерные программы для слепых, а в данном обзоре рассмотрим приложения для смартфона.
Программное обеспечение синтезатора речи выглядит в виде приложения, которое обеспечивает перевод текстовой информации в голосовую.
Большое разнообразие данной продукции не перестает удивлять пользователей, предлагаю подробно рассмотреть самые популярные.
Классификация приложений
Уже разработано и выпущено большое количество синтезаторов речи, с их помощью одно удовольствие не только воспринимать зрительно полезную информацию, но и слышать.
Данные программы делятся на два вида: платные и бесплатные.
Те программы, которые «шаровые» имеют более скудный арсенал возможностей, но тоже подлежат к использованию, с платными версиями дела обстоят повеселее, их обширность не знает предела.
Русскоязычные синтезаторы речи
Для таких операционных систем как Android, есть очень много вариантов синтезаторов речи, но большинство из них не имеют русскоязычных версий.
Рассмотрим несколько самых популярных экранных дикторов:
Acapela TTS Voices
Данная программа разработана для Android. Обладает высокими показателями синтеза речи, многоязычная, насчитывает 25 разных языков, в том числе и русифицирована.
Acapela TTS Voices
Есть возможность выбора голоса озвучки порядка 50 разных голосов. Радует довольно шустрый отклик, что делает работу в приложении очень удобной.
Разработчиками является Acapela Group S.A.. Примерная стоимость составляет 4 евро.
SVOX Classic TTS
Отличный движок, поможет читать в слух смс, книги и прочие текстовые файлы. Разработки SVOX успешно прошли все тесты, и используются такими марками, как Ferrari и BMW.
SVOX Classic TTS
В программе заложено 25 языков и 24 голоса озвучки. Использование программы открывает необъятные возможности. Стоимость приложения порядка 5 евро, но есть и бесплатные версии.
ESpeak
Мультиязычный синтезатор речи, который не является коммерческим. Обработка информации на 37-ми языках, озвучка хорошая есть много вариантов голосов.
Работает на нескольких операционных системах Linux, Mac OS, Microsoft Windows и RISC OS. Для правильного голосового воспроизведения, был разработан расширенный словарь.
Из-за некоммерческой деятельности программа работает немного хуже, чем платные приложения, но в планах у разработчиков есть идеи для улучшения работоспособности.
Настройка TTS
Первоначально необходимо определиться, какой из синтезаторов речи подходит больше всего. Скачать и установить приложение, после чего перейти к настройкам TTS. Разберем пошаговую инструкцию:
- Начинать необходимо с запуска;
- После чего необходимо зайти в настройки приложения;
- Выбрать и установить необходимый язык;
- Определиться с синтезом речи;
- Следует выбрать движок, чаще всего «автоматически»;
- Выставить скорость речи, которая подходит;
- По своему усмотрению настроить дополнительные параметры, необходимые для работы.
Svox главный экран
Когда все параметры выставлены, по необходимости, можно приступать к эксплуатации.
Использование экранного диктора TalkBack
TalkBack — это стандартный утилит, который обычно встроен в ОС Android. Данная функция была разработана для людей с проблемным зрением, слабовидящие люди благодаря TalkBack, могут пользоваться гаджетами без особых проблем.
При первоначальном запуске программы можно воспользоваться инструкцией. В экранном дикторе очень обширные настройки. Во всех устройствах, на разных видах прошивки, есть небольшие отличия настроек сервиса.
Использование экранного диктора talkback
Основными возможностями TalkBack считаются:
- Меняющийся уровень громкости воспроизведения;
- Возможность изменения тональности голоса;
- Озвучка каждого нажатия клавиш;
- Есть датчик расстояния, благодаря которому регулируется уровень звука;
- Устройство сообщает информацию о поступающих вызовах и смс, принцип АОН;
- Преобразование речи в текст и наоборот;
- Управление жестами.
Это основные возможности, но есть и большое разнообразие второстепенных.
TalkBack — незаменимое приложение для людей, которые утратили возможность видеть, пользоваться теми же устройствами, что и зрячие
Для слабовидящих это настоящая находка. Людям с полноценным зрением данное приложение не будет удобным, оно может раздражать, и замедлять процесс работы на устройстве.
Человеку, который не может ничего видеть, будет достаточно сложно настроить программу самостоятельно, поэтому лучше всего обратиться за помощью к окружающим людям.
Управление Android-устройством с помощью TalkBack
Для гаджетов, работающих на Android, есть возможность голосовой помощи в управлении. TalkBack произносит все иконки, на которые можно кликать пальцем, или просто во время передвижения по экрану.
В этом помогает функция «Изучение при касании». Есть подробная инструкция, как именно пользоваться этой функцией.
Управление Android-устройством с помощью TalkBack
После ознакомления с инструкций, у пользователей не возникает проблем с работой в устройстве.
Для того, чтобы выбрать нужную иконку и активировать элемент, достаточно нажать пальцем на значок, при этом произойдет воспроизведение голосовой подсказки. Так же удобства придает скроллинг, сопровождение которого происходит разной тональности.
Видео: Acapela Tts Voices для Android
Заключение
Разобравшись с работой и функционалом экранных дикторов, можно сделать следующие выводы:
- Дикторы являются незаменимой программой для людей с проблемным зрением и слепотой;
- При помощи таких программ можно озвучить любую тестовую информацию;
- Информацию, воспроизводимую голосом, легко превратить в написанный текст;
- Стоимость на голосовые дикторы небольшая, есть даже бесплатные.
Голосовые дикторы все чаще используют люди в повседневной жизни, принося программе большую популярность.
Источник
Обзор синтезаторов речи для Андроид
Приложения-синтезаторы речи – удобные и надежные помощники для Андроид пользователей. С их помощью можно «озвучить» приложения на самые популярные языки мира, настроить тембр голоса и другие важные параметры, а также учить языки, прослушивать звучание разных слов. Большинство TTS приложений для Android доступны бесплатно, однако за установку отдельных голосов и функций нужно доплатить. Мы подобрали для вас наиболее удобные синтезаторы речи, скачать которые можно на нашем сайте.
Синтез речи от Google
Жанр | Инструменты |
---|---|
Рейтинг | 4,1 |
Установки | 1 000 000 000–5 000 000 000 |
Разработчик | Google LLC |
Русский язык | есть |
Оценок | 1 107 289 |
Версия | 3.14.9 |
Размер apk | 14.7 MB |
Наиболее популярная и доступная TTS-утилита, совместимая со многими Андроид-девайсами. С помощью программы вы можете озвучивать текст на экране, а также выполнять ряд важных функций:
- Озвучивать книги приложения Google Play Книги.
- Переводить и озвучивать слова из Google Переводчика.
- Включать голосовые подсказки при помощи сервиса TalkBack.
Активировать приложение Синтез речи от Google можно прямо на своем девайсе. Для этого откройте пункт меню «Настройки», где зайдите в подраздел «Язык и методы ввода», а там – «Синтез речи». Выберите систему синтеза речи от Google, после чего приложение активируется автоматически.
Программа поддерживает более 40 языков, среди которых английский, русский, французский, немецкий, японский, испанский, датский, хинди и много других. В последней версии утилиты добавлено 3 новые языка – румынский, эстонский и словацкий, а также улучшено качество голоса в целом.
Acapela TTS Voices
Жанр | Связь |
---|---|
Рейтинг | 3,5 |
Установки | 100 000–500 000 |
Разработчик | Acapela Group S.A. |
Русский язык | нет |
Оценок | 3 883 |
Версия | 6.0.0.2 |
Размер apk | 9.3 MB |
Еще один качественный синтезатор речи на Андроид, который доступен на нашем портале. Программа является условно бесплатной, при этом перед тем, как купить приложение, вы можете прослушать демо-версии мужских и женских голосов в режиме онлайн. Утилита позволяет покупать и устанавливать программы с голосом высокого качества, такие как Google TalkBack, переводчики приложений для чтения книг и озвучивания новостей.
Для выбора и установки голоса в приложении войдите в меню, после чего нажмите на голос и удерживайте несколько секунд. Возле выбранного голоса появится значок желтой звезды, и он будет установлен по умолчанию. Теперь вы можете использовать эту программу с вашей любимой читалкой книг.
Приложение Acapela TTS Voices можно активировать следующими действиями.
- Загрузите сервис на нашем сайте или портале Google Play.
- После установки приложения кликните на иконку программы. Убедитесь в наличии Интернет-соединения.
- Ознакомьтесь со списком голосов, которые загружены с сервера.
- Нажмите на меню напротив каждого голоса, где можно прослушать собственный текст или сразу перейти к покупке.
- После покупки и оплаты голос будет загружен, и вы сможете пользоваться им в любое время.
Приложение Acapela TTS Voices совместимо с ОС Android 2.2 и более поздними версиями.
Источник
Обзор мобильных Text-To-Speech движков
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Для удобства разделим движки TTS на три класса:
- коммерческие;
- свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
- встроенные (средства, предоставляемые самой операционной системой).
Коммерческие движки
SVOX Mobile TTS
Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть
Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.
Acapela TTS
Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть
Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.
Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.
Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.
Loquendo Embedded TTS
Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть
Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.
Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.
Sakrament TTS
Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть
Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.
Свободные движки
Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)
В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.
eSpeak
Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)
Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.
eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.
Встроенные решения
Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian
Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть
Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.
Android
Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть
Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.
Заключение
Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.
Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.
Источник