Нужно написать код, который сам находит начало и конец речи в аудиофайле
09.05.2021
Доброго времени суток.Подскажите, пожалуйста, как сделать так, чтобы программа определяла, где начало речи, а где конец и отметить это на графике или любым другим способом.Коды приветствуются:)
Доброго времени суток.
Подскажите, пожалуйста, как сделать так, чтобы программа определяла, где начало речи, а где конец и отметить это на графике или любым другим способом.
Коды приветствуются:)
Комментарии
А что имеет место когда речи нет?
В каком смысле?
1. В прямом. Что в сигнале когда нет речи?
2. Ссылки.
Допустим, что тишина
Я понимаю, что там, где частота выше или ниже определённой, там и речь. Но как это показать на графике я не очень понимаю
1. На каком графике?
2. Самое простое:
- спектр голоса человека 0,3-3,4,
- вам нужн фильтр выделяющий эту полосу.
- и затем просто реле/детектор/т.п. который срабатывает при появлении сигнала.
3. А ссылка из самого первого сообщения описывает множество методов реально использующихся.
UPD: Даже на форуме кто-то из коллег статью размещал на подобную тему. Лучше google'ить перед тем как задавать вопрос
Задача, которую вы обозначили, может решаться самыми различными подходами, вплоть до глубокого обучения. Но если у вас действительно в сигнале может присутствовать или только речь, или тишина, то тут просто пороговый детектор в помощь. Уровень сигнала больше порогового значения - это речь.