Loquendo olga для андроид

Содержание

TTS: Acapela, Loquendo, Nuance, SVOX
Android — системные программы
Обзор мобильных Text-To-Speech движков
Коммерческие движки
Свободные движки
Встроенные решения
Заключение
Loquendo olga для андроид

TTS: Acapela, Loquendo, Nuance, SVOX

Android — системные программы

~~Лучшая на маркете система озвучивания текста.~~ — так здесь было написано раньше про SVOX, потому что.. альтернативы практически и не было.
Теперь же, благодаря стараниям толковых ребят с 4pda.ru и Вашего покорного слуги, мы можем выбирать из 4-х систем преобразования текста в речь (TTS = Text To Speech). Все они могут озвучивать текст не только в системных приложениях с подержкой TTS, но также и в сторонних программах, таких как, например, Moon+ Reader Pro , ezPDF Reader Pro , Full Screen Caller ID , Cool Reader и gReader Pro.
Скриншот оставил от SVOX — он тут и был, да и настройки в нем шире. Остальное — по разделам.
Итак, поехали..

Устанавливаем движок, НЕ ЗАПУСКАЕМ ЕГО НИКОГДА. голос распаковываем в корень sdcard.
Далее нам потребуется Root Explorer.
С его помощью заходим в /mnt/sdcard/acapelavoices и там у двух файлов — .temporary и logfile.txt изменяем разрешения, снимаем галочку Запись и сохраняем, чтобы в итоге разрешения выглядели как —xr-xr-x
Сразу предупреждаю — движок капризный, хоть я его и лечил лакипатчером, файлы голоса на флешке могут пропадать — так что архив не удаляйте, распакуете еще раз.
Включение — стандартное в настройках телефона, подробности на скриншоте.

Данный релиз был выдернут умельцами 4пда из навигации Sygic Aura 12.
Устанавливаем нужный движок — или оба сразу, голоса распаковываем в корень sdcard.
Включение — стандартное в настройках телефона, подробности на скриншоте.

Если у Вас OS 4.X — попробуйте вот этот универсальный движок (5.45 Mb) для обоих голосов. Я его проверить не смог — не на чем. О результатах пишите в комментариях.

Движок (989 Kb)
Голос (старый) (48.21 Мб)
Голос (НОВЫЙ!) (torrent) (397.25 Мб) — согласен, вес дикий! но качество.. я прям обалдел.. практически идеальный голос..

Данный релиз был выдернут умельцами 4пда из навигации TomTom 1.0.
Устанавливаем движок, голос распаковываем в корень sdcard.
Этот движок не имеет ярлыка в меню приложений.
Включение — стандартное в настройках телефона, подробности на скриншоте.

Устанавливаем сначала оболочку для своей оси, потом нужный движок — или оба сразу, голоса распаковываем в корень sdcard.
Включение — стандартное в настройках телефона, подробности на скриншоте.
За лечение голосов от жадности не забываем благодарить ChelpuS !
Если же голоса все равно будут ругаться на лицензию — патчим ядро и ставим взломанный маркет, все подробности в теме LuckyPatcher-а.

Все установочные дистрибутивы проверены на вирусы с помощью

Комментарии об ошибках от пользователей с незаполненным профилем, либо без указания модели телефона и версии прошивки, будут безжалостно удаляться!

Источник

Обзор мобильных Text-To-Speech движков

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

коммерческие;
свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS

Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Acapela TTS

Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть

Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.

Loquendo Embedded TTS

Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть

Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.

Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.

Sakrament TTS

Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть

Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.

Свободные движки

Flite

Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.

eSpeak

Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.

eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).

Symbian

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.

Android

Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть

Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.

Заключение

Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.

Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.

Источник

Loquendo olga для андроид

Advanced Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Microsoft Agent / Speech API

Microsoft Agent — это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи. Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista — полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista — Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.
[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech — TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.

Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):

1. Acapela-Group Алёна 22Khz — 150Mb — SAPI5/SAPI4 — Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (

100MB — SAPI5 — Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина 22Khz — 44MB — SAPI5 (бывшая Татьяна-SAPI4) — что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 — Николай (Nicolai) 16Khz — 12MB SAPI4 + SAPI5 — эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно — ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia — SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 — работает только с одной встроенной программой — с другими не хочет — так уж устроен.
5. Сакрамент — Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) — Судя по образцам с сайта производителя качество голосов не очень — однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает — диск защищен «StarForce 3.02 protector» — так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать — вставлять диск, но мне надоело (достало).
6. Сакрамент — Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5— (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller — что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент — Рассказчик 1 (Борис) 6.5MB SAPI5 — Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван — Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP — точно не помню но кажется это был словарь вместе с TTS — качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB— сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB — то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4 (мужской и женский голос) 3MB — Что-то слабо похожее на русскую речь.

Итого — 22 (или 24 по разным источникам) возможных голосов на Русском языке.

В общем я лично пока рекомендую (из общедоступных) только 4 голоса:

1) Acapela-Group Алёна 22Khz — SAPI5/SAPI4
2) Loquendo Ольга / Loquendo Дмитри
3) Nicolai (v5.1 — лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
4) Katerina
(остальные пока слушать трудно — в следствии более низкого качества) но стоит упомянуть об их болезнях:

Многие считают что: Nicolai — голос выразительного дауна (или выразительного робота). Katerina — истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).

5) — как опция Сакрамент — Рассказчик 3 — но проблема с диском.

Ну а программы для их использования — это дело вкуса и отдельный разговор.

По поводу других языков — из самых известных производителей можно отметить достижения следующих разработчиков:

Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

DeskBot (рекомендуется версия mini) — полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты — реверберация, шепот и др., всего 1 Мб. Всего записей: 722 | Зарегистр. 10-11-2005 | Отправлено:19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019

MaxMIsaev

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору В честь наступления Года Кролика (в этом году китайский Новый Год наступает 3 февраля), в начале февраля резко, хотя и кратковременно, снижены цены на программу Русак! (RussAcc — озвучиватель текстов, создатель аудиокниг, расстановщик ударений). Подробности на сайте: http://bzsoft.spb.ru/russacc.html

Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 11:15 02-02-2011

WWN

Silver Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата:

как такое может быть

If you’re running a 64 bit version of windows, when you display the speech control panel, the panel will display only 64 bit voices installed on your system. To date, the only 64 bit voice we’ve run across is Microsoft Anna. In order to display 32 bit voices, you need to run the 32 bit version of the speech control panel, here is how to do it.
То есть по умолчанию видна 64-разрядная контрольная панель, для которой есть только Анна Мастдаева

В висте-64 это фиксится просто, выбираем классический вид панели, кнопку 32-контрольная панель и текст-то-спич If you’re running Windows Vista, display the Control Panel from the Start Button, and click «Classic View» on the left pane. Click «View 32-bit Control Panel Items», and then click «Text-To-Speech». This should run the 32 bit speech control panel and display your 32 bit voices.

В семерке-64 в строке проводника вводим:
%windir%\SysWOW64\speech\SpeechUX\sapi.cpl
и жмем кнопку энтер, и будет вам щастье

equivalent in Windows 7 64bit, but you can access the 32 bit speech control panel by opening windows explorer, and pasting the following text into the address field at the top:

Press the enter key to display the control panel.

Всего записей: 2063 | Зарегистр. 04-03-2006 | Отправлено: 10:06 08-03-2011 | Исправлено: WWN, 18:53 09-03-2011

MaxMIsaev

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Вышла новая версия RussAcc — 1.0.5.
http://bzsoft.spb.ru/russacc.html
Что нового:
— Обновлены базы и алгоритмы расстановки ударений.
— Улучшена система регистрации, особенно под Vista/64 и Win 7/64.
— Несколько ускорена расстановка ударений.
— Изменены цвета подсветки по умолчанию.
— Индикация времени расстановки ударений.
— Число недавних файлов увеличено до 16.
— English версия.

Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 18:03 13-04-2011

Viper25

Full Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата:

Acapela-Group Алёна 22Khz — 150Mb — SAPI5/SAPI4

Дайте, плиз, ссылку на Варезник.

Всего записей: 564 | Зарегистр. 03-03-2006 | Отправлено: 11:21 06-05-2011

ukur

Junior Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Viper25
Infovox desktop pro 2

Всего записей: 151 | Зарегистр. 07-12-2007 | Отправлено: 22:43 14-05-2011

Stroodder

Advanced Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору MaxMIsaev
Не рановато такую поделку пиарить да еще и деньги просить за нее?

Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 13:04 15-05-2011

king_stiven

Silver Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Да пусть пиарит, лучше б сюда ссылки на отзывы о ней скинул.

Всего записей: 2182 | Зарегистр. 17-07-2006 | Отправлено: 11:50 16-05-2011

MaxMIsaev

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Вышла новая версия RussAcc — 1.0.6.
http://bzsoft.spb.ru/russacc.html
Что нового:

— Добавлено преобразование ударений в файлах из стиля Nicolai (угловые скобки) в стили движков Alyona (Acapela) и Loquendo.
— Добавлено преобразование файлов *.fb2 (Fiction book) в файлы *.txt.
— Скорректирован порядок записи информации о последнем файле, текстовых позициях и последних папках для случая, когда запущено несколько копий программы.
— Обновлены базы и алгоритмы расстановки ударений.

Отзывы на сайте, весьма положительные, и там только их малая часть. Отсутствие малейших аргументов при охаивании — очевиднейший признак черного пиара. То, что это совсем не поделка, очевидно по очень многим ее аспектам и даже по наградам. Но «ты виноват уж потому, что хочется мне кушать».

Всего записей: 16 | Зарегистр. 16-03-2009 | Отправлено: 14:10 17-05-2011

Stroodder

Advanced Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору MaxMIsaev
Да не глупи, тебе подсказывают, а ты щеришься. Ветку свою открой на форуме. Меню-заготовка в проге и то осталось. Преобразования чисел, дат, имен нету, защиту попытался сделать, молодец, пытайся дальше )).

Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 19:06 17-05-2011

king_stiven

Silver Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Я заходил на форум 2×2 там тоже не хвалят.

Всего записей: 2182 | Зарегистр. 17-07-2006 | Отправлено: 19:29 17-05-2011

Stroodder

Advanced Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору MaxMIsaev
«Как написано в одном из форумов, «в Алене простановка ударений в тексте изначально не предусмотрена». Поэтому в движок добавляют словарь омографов»

Ну. после этого (кстати не нашел где там расстановка ударений для Ольги, комбинацию при выходе этого движка в паблик, опубликовал вроде как Stroodder, как мне помнится =) ) совсем интерес пропал, кому оно надо, если за три года конструктивного сдвига не было

P.S. Подход очень напоминает подход ШХ, с чем вас обоих и поздравляю, умственнопервичные м/б и купят. Но дальше обсуждать это недоразумение, основанное на чужих разработках смысла не вижу.

Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 19:23 18-05-2011 | Исправлено: Stroodder, 19:29 18-05-2011

manram

Newbie

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору где можно скачать это?-Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista [?]

Всего записей: 1 | Зарегистр. 18-07-2011 | Отправлено: 15:59 18-07-2011

Krestkz

Junior Member

Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Народ

дайте живые ссылки на (с лекарством)

Elizabeth — female — UK English
Kate — female — UK English
Simon — male — UK English

Olga — female — Russian
Дмитрий — male — Russian

Источник

Читайте также: Guns royale для android