Синтез речи от «Наносемантики» оперативно пополнил словарный запас

19.09.2022

13 сентября 2022 года в орфографический словарь Института русского языка имени В.В. Виноградова добавлено 151 новое слово. Синтез речи NLab TTS (технология Text-to-Speech) компании «Наносемантика» уже знает и умеет правильно произносить новые слова. Голос для синтеза речи Наташа продемонстрировал «знание» таких слов, как «стендап», «кроссфит», «джетлаг» и других.

Nanosemantic.png

Далеко не секрет, что лексикон человека пополняется новыми словами из года в год. Так, например, в орфографическом словаре появились как традиционно-славянские термины (например, «ни пито ни едено»), так и разговорный заимствованный сленг миллениалов и зумеров, к примеру, «погуглить», «ретвитнуть».

При этом важно, чтобы развитие речевых технологий на базе искусственного интеллекта шло параллельно с развитием русского языка и пополнением вокабуляра пользователей. Именно поэтому задача по расширению «возможностей» синтеза является первостепенной и постоянной задачей для программистов «Наносемантики».

Непрерывная работа сегодня ведется также в следующих областях:

  • Улучшение звучания синтеза речи на русском и на английском языках. Голосовые модели постоянно дорабатываются, чтобы конечный аудио-результат максимально напоминал речь живого человека
  • Расширение пула дикторов. Добавление новых голосов (профессиональных дикторов), для максимально комфортного и удобного использования конечного продукта пользователями
  • Разработка создания кастомных голосов. В результате это позволит клиентам получить свой обученный голос при предоставлении небольшого датасета (набора данных) записанных аудио, а процесс создания такого голоса будет происходить в автоматическом режиме.




Компания-источник:  Наносемантика