Голосовая биометрия и определение намерений пользователя: какие подходы и где взять датасет?
В рамках написания дипломной работы по машинному обучению есть тема из реальной практики. Если кратко, это звонки в службу поддержки (см. ниже). Ищу идеи, какие могут быть реализации. Также интересуют датасеты для обучения алгоритма (реальных звонков в службу поддержки нет, значит, надо найти анонимизированную базу либо создать свою - по нескольку десятков голосов на каждую из тем обращений клиентов: как это сделать?)
Описание
В контакт-центр поступает множество обращений. Необходимо автоматизировать процесс идентификации абонентов для уменьшения времени консультации (тематика - услуги связи, ТВ, домфона). Для этого требуется разработать сервис, способный по первым фразам человека определять, кто звонит и с каким предположительно вопросом.
Идентификация абонентов - это голосовая биометрия (распознавание речи)
Идентификация намерений абонента (NLP). Здесь, на мой взгляд, есть смысл задать перечень вероятных намерений и относить конкретный звонок в один из классов возможных намерений.
Резюме - вот что нам требуется:
- технология голосовой биометрии (для телефонного канала)
- технология распознавания спонтанной речи (для телефонного канала)
- собственно модель для классификации намерения пользователей