• Регистрация
Статьи и вопросы по тегу "Речь"

Статьи и вопросы по тегу "Речь"

  • Все 2
  • Вопросы 1
  • Статьи 1
Используйте сторонние API для текста к речи и речи в тексте. Подробнее в документации.
  • вопрос
  • 02.04.2022
choisetheone
choisetheone 0.00
н/д
Приветствую! Возникла необходимость собрать в Simulink'е модель, где маскируется речь в реальном времени посредством инверсии спектра. На сколько я понимаю, самый простой вариант - воспользоваться мод...
Приветствую! Возникла необходимость собрать в Simulink'е модель, где маскируется речь в реальном времени посредством инверсии спектра. На сколько я понимаю, самый простой вариант - воспользоваться мод...
1 Ответ
02.04.2022
  • Публикация
  • 11.04.2021
Алан Алимурадов
Алан Алимурадов 0.00
н/д
Функция сегментации речь/пауза на основе энергетического анализа фрагментов речевого сигнала с помощью энергетического оператора Тигера с последующим анализом значений количества пересечения через нулевую ось и кратковременной энергии функции энергетической ха...

В статье представлен модернизированный способ сегментации речевых сигналов, обеспечивающий повышение эффективности обнаружения вокализованных, невокализованных участков и пауз за счет применения энергетического оператора Тигера. Суть способа заключается в энергетическом анализе фрагментов речевого сигнала с помощью энергетического оператора Тигера с последующим анализом значений количества пересечения через нулевую ось и кратковременной энергии функции энергетической характеристики. Проведено исследование, в рамках которого оценивалась эффективность и помехоустойчивость модернизированного способа в сравнении со способами на основе анализа количества пересечения через нулевую ось, кратковременной энергии и одномерного расстояния Махаланобиса. В соответствии с полученными результатами исследований сделаны следующие выводы: за счет хорошей восприимчивости энергетического оператора Тигера к изменениям амплитуды и частоты сигнала модернизированный способ обеспечивает повышение эффективности сегментации речевых сигналов, в том числе и зашумленных; в зависимости от требований к точности сегментации модернизированный способ обеспечивает вариативность значений ошибок первого и второго рода за счет изменения коэффициента порога.

11.04.2021