Перейти к содержанию
Авторизация  
ACIK

Почему программы "синтеза речи" так плохо говорят по-русски?

  

20 проголосовавших

У вас нет разрешения голосовать в этом опросе или просматривать его результаты. Пожалуйста, войдите или зарегистрируйтесь для возможности голосования в этом опросе.

Рекомендуемые сообщения

На дворе 2013-й... Американцы уже давно "развлекаются" с Сири. А нормальную русскую речь можно услышать пока только из уст человека.

Почему? Каково мнение форумчан?

Изменено пользователем ACIK

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

А нормальную русскую речь можно услышать пока только из уст человека.

Давно уже не пользуюсь синтезаторами речи (знакомых по телефону поздравлял с днем рождения, такой шок был в начале :) ). Но в свое время выделял в тексте большими буквами гласные на которые надо делать ударение и синтезатор читал нормально. Ну и еще со знаками препинания можно побаловаться.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Гугл переводчик вроде нормально, даже с выражением произносит.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Добавлю. Пробовал платный! движок (2006 года) от Sakramet - гадость полная... У Ирины звук как у молдовано-эстонского суржика... а тратить кучу времени на настройки, что за бред для коммерческого изделия. Вдобавок svchost выжирает проц на 100%.

 

Про раритеты Digalo 2000 и Speech Cube еще для SAPI4 вообще говорить не хочется...

 

TTS от Microsoft тоже далеко не идеал.

 

Бесплатный Коля от Acapela 2008 года (в годах могу ошибаться) - сильно металлический голос. Платная Алена звучит гораздо лучше всех предыдущих, но ужасно "спотыкается" на длинных составных словах и имеет мАААсковский акцент.

 

Татьяна от IVONA - почти те же "грабли": ужасное произношение буков Е и А (итог: ужасный акцент).

 

Как ни старался настроить словари Ольги от Loquendo, результат один - плохо.

 

Соглашусь с ajina.n:

Лучшее, что слышал - TTS от Гугла на андроиде в переводчике (бесплатно!), но до идеала еще далеко. И как этот TTS влепить в Windows?

 

Под windows гугл-переводчик говорит просто ужасно... может дело в "окнах"?

Изменено пользователем ACIK

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть такой термин - "зловещая долина" - оно применимо и к человекоподобным роботам, и к анимации в кино, и к синтезу речи. Пока синтезаторы говорили монотонным и корявым "голосом робота", то 20 лет назад это воспринималось как великое чудо и вызывало удивление (при этом никто не ожидал, что "робот" будет говорить по нормальному). Когда синтезатор начинает приближаться к человеческой речи по качеству, мы тут же попадаем в ту самую "зловещую долину" - мозг начинает регистрировать акцент, неправильные ударения, проблемы дикции, неуместное произносимому выражение, небольшие паузы в речи и т.п.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Есть такой термин - "зловещая долина" - оно применимо и к человекоподобным роботам, и к анимации в кино, и к синтезу речи. Пока синтезаторы говорили монотонным и корявым "голосом робота", то 20 лет назад это воспринималось как великое чудо и вызывало удивление (при этом никто не ожидал, что "робот" будет говорить по нормальному). Когда синтезатор начинает приближаться к человеческой речи по качеству, мы тут же попадаем в ту самую "зловещую долину" - мозг начинает регистрировать акцент, неправильные ударения, проблемы дикции, неуместное произносимому выражение, небольшие паузы в речи и т.п.

"вы исчерпали лимит положительных оценок на сегодня" :(

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

NextUp TextAloud 3.0.58 Portable + Голосовые модули (RUS/ENG)

Наткнулся на такой вот "инструмент". Сам не пользовался (не нашел времени, да и необходимости пока не было), но желающие могут попробовать. Описание по ссылке:

http://nnm.me/blogs/obraz01/nextup-textaloud-3-0-58-portable-golosovye-moduli-rus-eng/#cut

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

NextUp TextAloud 3.0.58 Portable + Голосовые модули (RUS/ENG)

Наткнулся на такой вот "инструмент".

Программ произносящими текст голосом много, например Балаболка, а вот голосовые движки это отдельная вещь, в данном "инструменте" интегрирован русский движок от производителя программы - NextUp-ScanSoft Katerina Russian Voice, он есть и отдельно. Другие (иностранные) движки меня не интересуют, они больше востребованы изучающими язык

Изменено пользователем kmscom

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

И как этот TTS влепить в Windows?

Благодаря форуму по андроиду мне получилось найти очень интересную тему касательно TTS и голосовым движкам. Тема накопила очень богатый опыт и благодаря этому накопили хороший вклад, который по возможности реализовывают в жизнь.

В качестве направления посоветую Вам копать в сторону голосовых движков SVOX Classic Text To Speech Engine на базе Nuance Vocalizer, а голосовые наборы для них доступны здесь. При чём ошибке в произношении можно исправлять путём наполнения базы, за основу можно взять готовые наработки ;)

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Авторизация  

×
×
  • Создать...