Китайская поисковая система Sogou создает двойников искусственного интеллекта, чтобы читать популярные романы голосами авторов.
Компания анонсировала «реалистичные» аватары китайских авторов Юэ Гуана и Бу Синь Тянь Шаня Дяо Сиань Бина, созданные на основе видеозаписей, на конференции China Online Literature +.
В прошлом году Sogou запустил две программы чтения новостей AI, которые все еще используются правительственным агентством новостей Синьхуа. Теперь это простой процесс использования технологии преобразования текста в речь для быстрого создания аудиоверсии книги с использованием оцифрованных синтетических голосов.
Но большинство людей предпочитают аудиокниги, которые «профессионально рассказывают» авторы, актеры или известные общественные деятели. И теперь, достижения в области машинного обучения и технологий преобразования речи в текст означают, что оцифрованные голоса становятся более реалистичными.
Например, компания Lyrebird позволяет клиентам создавать собственные «вокальные аватары» всего за одну минуту записи их голосов. На своем веб-сайте она демонстрирует свои услуги с помощью двух аудиозаписей бывшего президента США Барака Обамы и нынешнего президента США Дональда Трампа, созданных с использованием машинного обучения.
Между тем, лондонский технологический стартап DeepZen заявляет, что его синтетическая речевая технология может создать несколько версий аудиокниги в течение нескольких часов, сократив время и затраты примерно на 90%.