- Обзор мобильных Text-To-Speech движков
- Коммерческие движки
- Свободные движки
- Встроенные решения
- Заключение
- Приложения для изменения голоса
- Приложения с малым функционалом.
- Преобразователь голоса
- Модулятор голоса
- VoiceFX — изменение голоса с помощью эффектов
- Voicer — смена голоса на звезду, прикол, мем, ржач.
- Voice Changer
- Приложения с расширенным функционалом
- Voice Editor — Voice Changer & Recorder.
- Voloco: автонастройка голоса + гармонизация
- Vocoder — изменение голоса
- Топ интересных голосовых помощников для Android
- Яндекс Алиса
- Google Now
- Ассистент Дуся
- Google Assistant
- ROBIN
- Amazon Alexa
- Bixby
- ОКЕЙ, БЛОКНОТИК!
- Помощники для ПК
Обзор мобильных Text-To-Speech движков
Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.
В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.
Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.
Для удобства разделим движки TTS на три класса:
- коммерческие;
- свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
- встроенные (средства, предоставляемые самой операционной системой).
Коммерческие движки
SVOX Mobile TTS
Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть
Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.
Acapela TTS
Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть
Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.
Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.
Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.
Loquendo Embedded TTS
Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть
Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.
Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.
Sakrament TTS
Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть
Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.
Свободные движки
Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)
В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.
eSpeak
Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)
Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.
eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.
Встроенные решения
Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian
Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть
Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.
Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.
Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.
Android
Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть
Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.
Заключение
Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.
Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.
Источник
Приложения для изменения голоса
05.12.2021, Дмитрий Баринов
Программы для преобразования голоса активно применяются пользователями для развлекательных целей, обработки и монтажа, конспирации и некоторых других.
Такие программы можно найти на все существующие устройства: IOS, Windows, Android. Далее будут рассмотрены популярные представители на мобильные платформы.
Приложения с малым функционалом.
Преобразователь голоса
Это программа устанавливается на телефоны с системой Android из Google play, а также доступен на IOS. Представляет собой больше развлекательный, чем серьезный инструмент. Имеет простой интерфейс и небольшой функционал. Позволяет записывать голосовое сообщение и преобразовывать его в один из доступных вариантов. Присутствует около 30 возможных вариантов изменения голоса, среди которых есть:
Приложение позволяет сохранять измененный вариант на устройство, делиться им в социальных сетях, а также создавать видеоряд с использованием полученной записи. Запись можно использовать в качестве рингтона.
Модулятор голоса
Следующее приложение также устанавливается на телефоны с системой Android, а также IOS. Относится она также к развлекательным программам. Интерфейс, как и в предыдущем варианте, интуитивно понятен, а функционал практически идентичен предыдущему варианту. Тут добавляется несколько возможных вариантов для преобразования, например «бурундук», «иностранец», «под водой». Сохранилась возможность делиться полученными записями и сохранять их на устройство, устанавливать в качестве рингтона на звонки или уведомления. А вот возможность создания видеоряда отсутствует.
VoiceFX — изменение голоса с помощью эффектов
Данное приложение практически полностью копирует рассмотренные. Добавлено несколько вариантов обработки, например, «двойной голос», «выпивший» и некоторые другие. Сохранять результат записи можно в MP3 формате, делиться в социальных сетях, устанавливать в качестве рингтонов. Устанавливается на Android и IOS.
Voicer — смена голоса на звезду, прикол, мем, ржач.
Еще одна программа для скачивания на Android и IOS смартфоны. Пользуется меньшей популярностью, чем выше названные. Чаще всего используется для записи клипа для Instagram Stories. Она уже имеет ряд определенных отличий от предшественников. Самое главное — она платная. Большинство контента в ней доступно лишь в течении пробного периода (3дня), а далее лишь по подписке 2 999р в год. Изменять же голос программа предлагает на голоса знаменитостей и политиков, а также на персонажей некоторых фильмов. Например, доступны голоса Трампа, доктора Стренджа, Локи, Роберта Дауни мл. и другие. Приложение позволяет записывать видеоряд с измененным на выбранную личность голосом. В последствии полученной записью можно делиться или сохранить ее на устройство.
Voice Changer
Эта программа является аналогией остальных в сегменте приложений с невысоким функционалом. Простейшая запись голоса с последующей обработкой несколькими доступными фильтрами, дальнейшее сохранение результата или его отправка в разные социальные сети.
Приложения с расширенным функционалом
Voice Editor — Voice Changer & Recorder.
Данная программа уже является куда более расширенным вариантов приложений для изменения голоса. Ставится она все с того же Google play и доступна для Android. Ее функционал уже интереснее, чем рассмотренные ранее варианты. Во-первых, приложение предоставляет куда больше вариантов для изменения голоса. Помимо стандартного списка тут присутствует множество пародий на голоса героев фильмов и мультипликаций. Появилась возможность обработки звука, пускай и не слишком широкий. Речь идет про возможность разрезания записанного материала и вырезания некоторых его частей. Помимо этого, присутствует регулятор частот, усилитель басов и других тонов. Приложение поддерживает работу с Tik-Tok, позволяет имитировать различные звуковые сцены (театр, караоке, студия и другие).
Voloco: автонастройка голоса + гармонизация
Программа идет на обе платформы — IOS и Android. Ее тоже можно отнести в разряд более продвинутых редакторов голоса. Записанный звук можно подвергать таким обработкам как:
- автотюннинг
- стерео-тишина
- обрезка и вырезания
- плотность
- добавление битов
Приложение позволит запускать треки из библиотеки, записывая свой голос под них, подвергая обработке. Полученные результаты можно загружать себе и делиться.
Vocoder — изменение голоса
Это приложение можно установить и на IOS и на Android. Обладает меньшим функционалом, чем другие программы в сегменте с расширенными возможностями. Большим минусом является отсутствие возможности использования без наушников. В остальном же присутствует возможность добавлять эффекты к записи, добавлять некоторые алгоритмы, контролировать диапазон тона.
Все программы из данного списка предоставляют возможность изменять записанный голос, но только некоторые из них позволяют проводить действительно глубокую обработку.
Источник
Топ интересных голосовых помощников для Android
В наше время человечество стремится развивать искусственный интеллект. Роботы стали незаменимыми помощниками во многих отраслях. Конечно, прогресс шагнул далеко вперед, но пока искусственный интеллект все же не может полностью заменить человека, хотя такие возможности не за горами. Теперь виртуальные помощники являются частью нашей жизни, и во многих домах можно встретить умную технику. Самым продвинутым считается Siri, и это неудивительно. Данного помощника Apple целых шесть лет совершенствовала и доводила до ума. Siri прекрасно понимает русский язык и также говорит на нем. Обладателям Android-устройств все же не стоит расстраиваться, т.к. прогресс не стоит на месте и для них тоже появились виртуальные помощники, говорящие на русском языке.
В этой статье мы рассмотрим самых интересных голосовых помощников для Android.
Яндекс Алиса
Начнем, пожалуй, с умного и продвинутого, говорящего на русском языке помощника, созданного самым популярным поисковиком в России. Это самый молодой голосовой помощник, созданный в 2017 году. С Алисой можно поговорить, поиграть в города, она умеет кокетничать с пользователем. Кроме простых вопросов, Алиса может дать ответ и на сложные, т.к. она взаимодействует со всеми ресурсами Яндекс. Одним словом — скучно с ней не будет. Кроме развлечений, ее можно попросить найти место, где можно покушать, например, или показать короткий путь до библиотеки. Алиса поможет перевести рубли в доллары и наоборот, покажет самый простой маршрут до твоей работы, расскажет прогноз погоды. Алиса постоянно находится в стадии обучения, а помогают ей в этом пользователи. Этот виртуальный помощник может не только пошутить, но и обидеться. От Алисы вы никогда не услышите грубости. В общем это перспективный и развивающийся проект, который с каждым разом становится лучше.
Google Now
Бесплатная программа, которую не надо скачивать. Ярлык появляется сразу после обновления устройства до Android 4.1. Это очень удобный голосовой помощник, который способен не только завести будильник на нужное время и включить таймер, но и найти нужный номер в телефонной книге и отправить смс, текст которого ему можно продиктовать. Google Now легко взаимодействует со всеми сервисами Google. Кроме вышеперечисленных способностей он может выполнять запросы поисков нужной информации в браузере. Конечно, поболтать с ним не получится, т.к. он способен выполнять только четкие команды. В новых версиях Android Google Now взаимодействует и с популярными мессенджерами вроде What`s App и Telegram. При желании Google Now можно установить и на iOS. Для этого его нужно просто скачать из AppStore.
Ассистент Дуся
«Дуся» создавалась как помощник, который совершенно не занимает места на экране гаджета, т.к. у нее полностью отсутствует интерфейс и работает она в фоновом режиме. Привести в действие ее можно голосом, взмахом и другими разными способами. Ассистент не будет шутить и кокетничать, в его программе четко заложены команды, которые он выполняет. С помощью «Дуси» вы сможете перевести простые фразы на 6 языков, завести будильник, выбрать удобный маршрут и многое другое. «Дуся» способна использовать все основные функции устройства Андроида и озвучивать голосом оповещения с других приложений. Кроме этого, разработчики утверждают, что ассистент способен самообучаться, а это очень неплохое качество. Минусом этого помощника является то, что он платный. После ознакомительной недели, пользователю придется оформлять подписку за 299 рублей.
Google Assistant
Это усовершенствованная версия Google Now. Она более функциональная и очень отличается от других голосовых помощников. С ним можно поговорить, помощник способен улавливать логическую цепочку в разговоре. Ассистент покажет вам самый удобный маршрут, расскажет о погоде на ближайшее время и посоветует, куда сходить в новом для вас городе. Он способен различать до шести голосов (это удобно, если устройством пользуется сразу несколько человек). Google Assistant разработан специально для Android, но при желании его можно установить и на устройства Apple. Виртуальный помощник способен не только отвечать на сложные вопросы, но и понимать их смысл, например, «Лучший романтический фильм?», Google Assistant продолжает развиваться и это не может не радовать.
ROBIN
Этот помощник был создан специально для автомобилистов. Он поможет написать сообщение, позвонить на нужный номер, узнать прогноз погоды, не прерывая движения и это очень удобно. Robin прекрасно владеет русским языком. Одним из главных отличий этого приложения — чувство юмора. Помощник способен рассказать анекдот и скрасить долгую дорогу водителю.
Amazon Alexa
С помощью этого помощника возможно совершать покупки в интернете, узнавать прогноз погоды, скачивать музыку, создавать списки дел и покупать и т.д. Многофункциональный и интересный виртуальный помощник Amazon Alexa. В настоящее время именно он считается самым умным голосовым помощником. Главным минусом является то, что он не говорит на русском и в ближайшее время не собирается учиться.
Bixby
Молодой голосовой помощник, который доступен пока только на английском языке и на определенных смартфонах от Samsung, а именно смартфонах Galaxy S8, S8 Plus и Galaxy Note 8. Bixby создавался главным образом не для поиска информации в интернете, а для управления функциями телефона. Это очень перспективный проект, который сейчас находится в стадии развития. Разработчики обещают в будущем удивить пользователей, т.к. хотят довести его до совершенства.
ОКЕЙ, БЛОКНОТИК!
Этот голосовой помощник не похож на вышеперечисленных. Это простая, довольно полезная, напоминалка с голосовым управлением. Напомнит вам о любом запланированном событии, главное дать ей задание. Пользователи высоко оценивают «Окей, Блокнотик!».
Помощники для ПК
Голосовые помощники бывают не только для смартфонов, но и для ПК. Не многие об этом знают и еще меньше тех кто ими пользуется. Например, в Windows 8 встроена утилита, которая называется Windows Speech Recognition, а в Windows 10 имеется интеллектуальный помощник Cortana, с помощью которой возможно делать заметки в календаре, настраивать систему, открывать файлы. Cortana не говорит на русском. Она владеет шестью языками: английский, китайский, французский, итальянский и испанский. К сожалению, в ближайшее, время русский язык не будет входить в этот список. Все же имеются помощники, которые поддерживают русский язык. К ним относятся:
- «Горыныч» – это помощник, который знает русский и английский языки. Речь он распознает не лучшим образом. Если человек охрипнет, то “Горыныч” его просто не поймет. Благодаря ему, пользователь сможет не использовать мышку и клавиатуру для выполнения некоторых задач.
- «Агрегат» – более усовершенствованная программа, которая владеет русским языком. Этот виртуальный помощник устанавливается на любую операционную программу. Пользователи могут расширить его возможности с помощью установки дополнительных модулей. Не обошлось и без минусов, данный ассистент находится пока на стадии тестирования и поэтому пользователю не удастся просто так установить его на свой ПК.
- Typle – очень простой помощник, который способен открывать файлы на ПК и управлять музыкальным проигрывателем.
Подводя итоги, можно сказать, что главную роль играют предпочтения пользователя. Для российских пользователей все же более полезны программы, которые изначально создавались на русском языке, чем те, которые просто поддерживают его. ИИ еще не достиг своего совершенства, но активно стремится к этому. А уж если за это взялись ведущие корпорации мира. можно быть уверенными в их скором успехе.
Источник