- ИИ-диктор: сравнение Смотри Mail.ru и Synthesia
- Дидактор
- педагогическая практика
- Как создать видеоурок с помощью сервиса Диктор Mail.ru
- Зоны степей
- Диктор Mail.ru: что это такое, как работает и как использовать в рекламе
- Что такое Диктор Mail.ru и как он работает
- Как создать ролик
- 5 идей по использованию для рекламщиков и маркетологов
- Mail.ru Group разработала виртуальных телеведущих
- Топ-17 синтезаторов речи. В какой программе озвучить текст.
- Перевод текста в речь на русском языке: лучшие программы
- Мобильные синтезаторы
- Синтезатор речи Google
- SpeechText
- Болтун
- Voice Aloud Reader
- Онлайн-синтезаторы
- Acapela
- Text-to-Speech
- Oddcast
- Linguatec
- iSpeech
- PilliApp
- ПК синтезаторы
- Robot Talk
- Балаболка
- Говорилка
- 2nd Speech Center
- Альтернативные синтезаторы
- Яндекс Переводчик
- Google Переводчик
- Как обработать аудиофайлы
ИИ-диктор: сравнение Смотри Mail.ru и Synthesia
Команда стартапа FASTEP разрабатывает ИИ-ассистента с дополненной реальностью для пользователей бытовой техники и промышленного оборудования. Мы постоянно ищем новые способы обращения к аудитории и никак не могли пройти мимо свежей ИИ-платформы для создания видеороликов с дикторами от Mail.ru.
В конце концов, эта тема нам не просто потенциально полезна, но и близка. Мы провели блиц-тест диктора от «Смотри Mail.ru» в реальном кейсе собственной рекламы и сравнили его с Synthesia, аналогом из США. А теперь хотим показать вам результаты.
Обе платформы находятся в бета-стадии и предлагают попробовать свои возможности на тестовом ролике. Этим мы и воспользовались.
Озвучить можно текст до 500 знаков. Есть возможность выбрать диктора, фон, добавить титры, а также фото или видео в левый верхний угол, как в настоящем новостном выпуске.
FASTEP — это ИИ-ассистент для работы с промышленным оборудованием. Он сам узнаёт технику, предлагает инструкции и показывает их в дополненной реальности. Графические подсказки закрепляются прямо на реальных органах управления. Даже если вы отвернулись, подсказка останется в правильном месте, а стрелка направит к ней. С FASTEP каждый рабочий и инженер становится экспертом. Подробности — на fastep.io
Пробный интерфейс Synthesia намного беднее. Здесь доступно только редактирование текста объёмом до 200 символов, а также выбор из трёх типов роликов. Сбоку показывают интерфейс, который можно будет получить за деньги. И он уже не уступает «мэйлрушному». Но доступ к нему выдают в индивидуальном порядке и только после того, как вы ответите на письмо, в котором вам пришлют ваш тестовый ролик.
Кстати, ролик присылают на email. Это удобно, но возможно лишь потому, что он небольшой — весит около двух мегабайт. Вес нашего ролика от «Смотри Mail.ru» составил около 44 мегабайт.
Текст для Synthesia:
FASTEP — это ИИ-ассистент для работы с промышленным оборудованием. Он сам узнаёт технику, предлагает инструкции и показывает их в дополненной реальности
Видео от Mail.ru сильно уступает по качеству озвучивания и мимики диктора. Российское решение также имеет интересный фокус на формат теленовостей. Интересно, будет ли он востребован?
Synthesia продемонстрировала преимущество по реалистичности графики и по звуку (даже на русском языке), но странно деавтоматизирована в части доступа к полному редактору.
Оба решения находятся в ранних стадиях развития, поэтому судить их по текущему состоянию мы считаем неправильным: ни один продукт не позиционируется как завершённый. Главное, что компании открывают к ним доступ, чтобы потребители могли оценить перспективы подобного софта — и заодно развлечься.
Нам на текущий момент более интересно ознакомиться с полной версией сервиса Synthesia.
Если вы тоже протестировали дикторов, расскажите о своих впечатлениях в комментариях. А лучше покажите, что получилось.
Источник
Дидактор
педагогическая практика
Как создать видеоурок с помощью сервиса Диктор Mail.ru
В условиях пандемии учитель ищет новые формы представления видеоуроков, которые могли бы разнообразить удалённое обучение. 14 июля 2020 года компания Mail.ru Group объявила о выходе бесплатного сервиса Диктор, с помощью которого вы можете создать видеоуроки, главными героями которых являются виртуальные дикторы. Видеоуроки представлены в виде новостных сюжетов с цифровыми ведущими. Сгенерированное с помощью сервиса видео можно сохранить на ПК или поделиться им в социальных сетях. Итак, давайте пошагово разберёмся в его возможностях.
В данном видео вы узнаете:
- как выбрать виртуального диктора
- как работать с текстом
- как добавить титры
- как вставить изображения
- как создать музыкальное сопровождение
- как сохранить полученный видеофайл
Напомню алгоритм создания видеоролика.
При создании видео сюжета пользователю сначала нужно выбрать диктора — доступны цифровые ведущие по имени Мария, Татьяна, Тамара и Анита. Также нужно выбрать положение диктора — сидя за столом или стоя.
Следующий шаг — выбор заднего фона для ролика из семи вариантов. Задний фон анимированный, согласно его выбранному типу.
Далее необходимо добавить текст для ролика, максимум 1000 символов, также можно вставлять паузу в реплики диктора. К сожалению, данная кнопка вряд ли вам пригодится. Пауза, как правило, слишком длинная. А она очень нужна, учитывая некоторую монотонность при электронной декламации. В видеообзоре я показал простейший путь:
Вместо запятых проставлять точки.
Тогда диктор делает паузы такой длины, как вам необходимо.
Как правило, генерация видеоролика проходит сравнительно долго: иногда до 10-ти минут. Так что наберитесь терпения.
После генерации видеоролика вы можете добавить изображения, титры, музыкальное сопровождение и ссылки. .
Посмотрите видеоурок, созданный во время обзора. Не забудьте включить звук внизу слева.
Зоны степей
После создания видеоурока вы сохраняете его, копируете ссылку или html-код, загружаете видео на свой компьютер. На вашу электронную почту поступит сообщение о создании ролика и ссылка на него.
Источник
Диктор Mail.ru: что это такое, как работает и как использовать в рекламе
Видеоролики активно используются в маркетинге – для рекламы и презентации продуктов, привлечения аудитории на ранних этапах воронки продаж, повышения узнаваемости бренда и даже получения конверсий. Правда, проблема в том, что съемка ролика – это часто дорогое и долгое производство, которое по карману не любому бизнесу.
Те, кто не хочет тратить бюджет на полноценный видеопродакшн, ищут другие решения. Порой нестандартные. Одним из них может стать Диктор Mail.ru. Разбираемся, что это такое и как работает.
Что такое Диктор Mail.ru и как он работает
Диктор Mail.ru – сервис для создания простых видеороликов без сложного продакшна. Его особенность – виртуальные ведущие, которые зачитают любой текст, делая паузы в нужных местах и расставляя акценты.
Демонстрация возможностей на сайте платформы
По мнению разработчиков, «Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты.»
Сервис работает бесплатно на базе платформы Mail.ru. Для использования не потребуются навыки видеомонтажа: создать ролик здесь не сложнее, чем в видеоконструкторах Яндекс.Директа и Google Ads.
В основе платформы Диктор Mail.ru лежит нейросеть, которая и отвечает за генерацию видеоряда с виртуальным ведущим, зачитывающим ваш текст. Самих цифровых дикторов создали с помощью Vision – технологии компьютерного зрения и распознавания лиц на базе машинного обучения от Mail.ru Cloud Solution. За синтез речи отвечали разработчики голосового помощника Маруся.
Как создать ролик
Чтобы создать видео в сервисе Диктор Mail.ru, нужно проделать несколько нехитрых действий.
1. Зарегистрироваться или войти в кабинет через почту Mail.ru или ВКонтакте.
2. Выбрать одного из четырех дикторов или пункт «Без диктора» (такой вариант подойдет, если хотите сделать ролик, например, в формате слайдшоу).
3. Выбрать план: стоя или сидя.
4. Выбрать фон из 7 вариантов – 5 студий и два городских вида. Добавить свой фон не получится, по крайней мере пока.
5. Добавить текст, который будет зачитывать диктор, и кликнуть «Создать диктора».
6. Дождаться, пока система сгенерирует ролик. Процесс может занять несколько минут.
Когда первый ролик будет готов, система проведет небольшой обзор по функционалу видеоредактора. Сам редактор выглядит так:
Далее вы можете:
посмотреть, что получилось;
отредактировать текст, если допустили ошибку или хотите что-то изменить. Тогда ролик придется генерировать заново;
отредактировать видеоряд с помощью инструмента «Лезвие» – вырезать кадры;
добавить к ролику титры, фото и/или видео, аудиофайл, ссылку и пэкшот;
сохранить видео и поделиться им.
Вот такой ролик о нашей платформе и партнерской программе получился у нас.
5 идей по использованию для рекламщиков и маркетологов
Инструмент позиционируется как платформа для создания видеоновостей в браузере с помощью нейросети. Однако функционал платформы позволяет делать любые ролики для любых целей, в том числе маркетинговых.
Вот несколько сценариев, в которых Диктор Mail.ru может пригодиться рекламщикам и маркетологам:
обзор цифрового продукта на посадочной странице. Продвигая новую программу или сервис, важно показать потенциальным пользователям интерфейс и функционал. Можно записать скринкаст, а вступительные фразы и пояснения по ходу сгенерировать с помощью Диктора Mail.ru;
видеообзоры товаров для интернет-магазина. Если интернет-магазин большой, снимать обзоры на каждый товар может быть затратно. Вместе с тем многим потенциальным покупателям удобнее посмотреть минутный ролик, чем вчитываться в описание и технические характеристики. С помощью Диктора Mail.ru можно сгенерировать такие обзоры, дополнив видеоряд с диктором фотографиями товара;
видеокреативы для контекстной и таргетированной рекламы. Тратить большие бюджеты на их создание часто бывает нецелесообразно: креативов нужно много, а какие из них сработают и будут в итоге использоваться, покажут только тесты. В такой ситуации бесплатный сервис на базе нейросети – это возможность протестировать, как пользователь реагирует на ролики с человеком в кадре. И активно использовать их, если они окажутся эффективны;
Источник
Mail.ru Group разработала виртуальных телеведущих
Компания Mail.ru Group объявила о запуске платформы «Диктор» на основе искусственного интеллекта, которая позволяет «в несколько кликов создавать новостные и репортажные видео студийного качества». Новая функция уже доступна в рамках сервиса «Смотри Mail.ru».
Инструмент не требует навыков видеомонтажа. Пользователям остается только загрузить текст, после чего система сделает все сама. Дополнительно можно выбрать внешность ведущего, поменять фон студии, создать слайд-шоу, наложить музыку или прикрепить ссылку. Получившийся ролик можно сохранить на компьютер или поделиться им в соцсетях.
Смотри https://t.co/WtjTzvZQSt запустил виртуальных ведущих новостей: видеосюжеты в несколько кликов. pic.twitter.com/1dRXzv7hEb
В компании ожидают, что новым инструментом воспользуются все участники медиарынка — от блогеров до крупных СМИ — для создания в сжатые сроки видеосюжетов в телевизионном формате. «Дикторы выглядят и разговаривают, как живые люди: при чтении новостей они реалистично воспроизводят мимику, эмоционально реагируют и расставляют смысловые акценты», — говорят в Mail.ru Group.
Для создания виртуальных телеведущих компания задействовала собственные технологии. Для синтеза голоса послужил речевой движок, созданный командой голосовой помощницы «Маруси», а для синхронизации видеоряда с речью в режиме реального времени были привлечены системы компьютерного зрения Vision.
«Видеосмотрение растет. По прогнозам, к 2022 году 79% всего интернет-трафика в России придется на онлайн-видео, — сказал заместитель вице-президента компании Егор Ганин. — Но производство видеосюжетов — сложный и дорогой процесс, который большинство медиаресурсов не могут себе позволить. В редакторе от Смотри Mail.ru можно создавать новостные и репортажные видео в хорошем качестве и абсолютно бесплатно. Мы уверены, что наша технология позволит увеличить количество качественного новостного видео-контента».
Проект по созданию «цифровых людей» есть и у Samsung. Ранее в интернет попал ролик, на котором показаны движения других виртуальных аватаров, причем выглядят они как живые люди, а не компьютерная анимация. В компании полагают, что «цифровой человек может стать частью нашей повседневной жизни: виртуальным ведущим новостей, виртуальным администратором или даже кинозвездой, созданной искусственным интеллектом».
Источник
Топ-17 синтезаторов речи. В какой программе озвучить текст.
Проверить, как правильно звучит слово, прочитать e-mail за рулём или озвучить текст робота в фильме – типичные ситуации, в которых вам может понадобиться синтезатор речи. Многие платные и бесплатные программы осуществляют перевод текста в речь на всех платформах, но не все они подходят русскоязычным пользователям. Озвучка текста на русском языке поддерживается далеко не всеми зарубежными ПО и онлайн-ресурсами. Да и их разработчики не всегда могут запрограммировать орфоэпические и интонационные нюансы.
Text-to-Speech | Онлайн | Продвинутые настройки | Зачитывание текста отрывками по 30 секунд |
Oddcast | Онлайн | Анимированные дикторы | Зачитывание текстов до 600 символов |
Robot Talk | Для ПК | Бесплатное приложение для Windows | Сохранение только в форматах WAV и WMA |
Балаболка | Для ПК | Чтение текста из файлов DOC, DOCX, PDF, DjVu, FB2 и т. д. | Для работы нужны установленные синтезаторы речи |
Говорилка | Для ПК | Использует словари произношений, что позволяет корректировать произношение слов и словосочетаний | Программа не вышла из бета-тестирования – возможны ошибки |
Яндекс Переводчик | Альтернативная опция | Знакомый голос бота «Алиса» | Нет настроек голоса и скорости |
Google Переводчик | Альтернативная опция | Большой выбор языков | Нет настроек голоса и скорости |
Все программы Свернуть таблицу
Перевод текста в речь на русском языке: лучшие программы
В этой подборке – только проверенные программы для озвучки, которые зачитают ваш текст без ошибок. В некоторых из них озвучивание текста доступно только в режиме онлайн, но есть и те, в которых предусмотрена функция экспорта файла для дальнейшего использования. Как правило, платные программы обладают расширенными возможностями настройки, а начитанный текст на выходе звучит более естественно.
Мобильные синтезаторы
Синтезатор речи Google
Собственное мультифункциональное приложение Google для перевода текста в речь. Именно оно отвечает за озвучивание текста в переводчике и чтение аудиокниг в Google Play, а также во многих других программах Play Маркета.
SpeechText
Это приложение в первую очередь для тех, кто хочет узнать правильное произношение иностранных слов. Не лучший вариант ввиду ограниченности функционала. Но в качестве подспорья при изучении языка его вполне хватает.
Болтун
Удобное приложение для устройств на Андроиде. Может озвучить текст SMS, электронное письмо, статью в браузере – любые тексты, которые вы скопируете в буфер обмена или введете прямо в приложение.
Voice Aloud Reader
Еще одно приложение, которое можно скачать в Google Play. Программа работает с загруженными текстовыми файлами и сохраненными текстами. Русский язык поддерживается. Можно выбирать интонацию и скорость чтения.
Онлайн-синтезаторы
Acapela
Один из самых известных синтезаторов речи. Разговаривает на 30 языках. Текст на русском языке вам могут зачитать мужским голосом Николай, а женским – Алёна. На бесплатное использование есть ограничение: в браузерной версии можно воспроизвести не больше 300 символов. Для использования полного функционала необходимо скачать платную программу – она доступна на Windows, Linux, Mac, а также на мобильных OC Android и IOS.
Text-to-Speech
Синтезатор речи с продвинутыми настройками: можно задавать скорость речи, размер шрифта и машинный перевод. Доступна даже экранная клавиатура для людей с ограниченными возможностями. На русском текст может зачитать здесь только женский голос.
Oddcast
На этом портале вам тоже не дадут озвучить более 300 символов разом. Зато русский язык поддерживается тремя голосами: одним мужским (Дмитрием) и двумя женскими (Милиной и Ольгой). Но главная фишка портала в том, что текст вам зачитывают анимированные дикторы. За это можно простить программе даже не самый удобный интерфейс.
Linguatec
Как и в случае с Acapela, больше определенного количества символов (здесь – 250) бесплатная версия вам озвучить не разрешит. Но зато с этой задачей она справляется очень неплохо. Здесь так же доступны два голоса – мужской (Юрий) и женский (Милена).
iSpeech
Простейший бесплатный инструмент для озвучивания коротких текстов размером не больше твита – максимум 150 символов. Зато полученный результат можно сохранить на компьютере. Русский язык поддерживается.
PilliApp
Программа не разговаривает больше 60 секунд, поэтому разработчики рекомендуют делить длинный текст на несколько строк. За русский язык отвечают голоса Юрия и Елены. Сайт программы явно переведен в автоматическом режиме, поэтому не удивляйтесь легкой странности текста на главной странице.
Отечественный онлайн-софт с возможностью расширенных настроек: можно отрегулировать скорость чтения, высоту тона, громкость и чтение знаков препинания. Выбор невелик – только Александр или Елена. Зато можно не копировать текст в окошко, а сразу загрузить в программу файл Microsoft Word. Минус этого сервиса в том, что мгновенно озвучить текст не получится: придется подождать в очереди на конвертацию.
ПК синтезаторы
Robot Talk
Бесплатное приложение магазина Windows. В программе всего 5 голосов: 3 мужских и 2 женских. Можно изменять тембр голоса и скорость речи. Полученный на выходе аудиофайл можно сохранить.
Балаболка
Умная и непривередливая программа, которая читает тексты практически любых форматов – DOC, PDF, PPTX, XLS и многих других. Для озвучки используются движки синтезаторов речи, которые уже присутствуют в вашем компьютере. Помимо распознавания текста в речь, софт предлагает проверку орфографии. По окончании работы аудиофайл можно экспортировать.
Говорилка
Словари произношений в этой программе постоянно пополняются, поэтому орфоэпических ошибок можно не бояться. Считывает текстовые файлы и прокручивает текст на экране, как телевизионный суфлер. Ограничений по объему текстов нет, поэтому это отличный вариант для тех, кто предпочитает аудиокниги электронным: достаточно загрузить книгу в программу – и можно слушать.
2nd Speech Center
Предельно понятный интерфейс и все та же возможность экспорта файла в MP3 и WAV. Программа поддерживает файлы в формате TXT, DOC, PDF, EML, RTF, HTM, HTML. Можно регулировать скорость получившегося текста – удобно, чтобы послушать учебные материалы на иностранном языке.
Альтернативные синтезаторы
Яндекс Переводчик
Как мы уже знаем благодаря боту «Алиса», у софта «Яндекса» все хорошо с распознаванием речи. Преобразование текста в речь в интерфейсе их переводчика тоже работает на ура. Никаких дополнительных настроек и возможностей экспорта не предусмотрено, но это стандартная практика для приложений-переводчиков.
Google Переводчик
Аналогично своему российскому коллеге, этот переводческий инструмент выполняет базовые задачи по озвучке текста. Подходит для сверки ударений. Мобильное приложение этого сервиса нередко выручает в путешествиях: достаточно напечатать или сказать в динамик нужную фразу, чтобы софт тут же озвучил ее перевод вашему иностранному собеседнику.
Как обработать аудиофайлы
С любой аудиодорожкой, даже если это сохраненный файл из синтезатора речи, можно сделать много крутых вещей: улучшить звук, ускорить его или замедлить, проиграть обратно, убрать шумы, добавить аудиоэффекты или совместить с музыкальным фоном. И, конечно, можно наложить аудиотрек на видео для озвучки клипа. Большой простор для творчества со звуком и видеозаписями дает программа Movavi Video Suite. В ней можно не только работать с готовыми аудиофайлами, но и записать собственный аудиотрек или закадровый комментарий для видео, а также захватить звук с экрана компьютера и потом обработать его, если нужно. Movavi Video Suite включает также возможность конвертировать любые медиаформаты.
Источник