Голосовая биометрия и определение намерений пользователя: какие подходы и где взять датасет?

В рамках написания дипломной работы по машинному обучению есть тема из реальной практики. Если кратко, это звонки в службу поддержки (см. ниже). Ищу идеи, какие могут быть реализации. Также интересуют датасеты для обучения алгоритма (реальных звонков в службу поддержки нет, значит, надо найти анонимизированную базу либо создать свою - по нескольку десятков голосов на каждую из тем обращений клиентов: как это сделать?)

Описание

В контакт-центр поступает множество обращений. Необходимо автоматизировать процесс идентификации абонентов для уменьшения времени консультации (тематика - услуги связи, ТВ, домфона). Для этого требуется разработать сервис, способный по первым фразам человека определять, кто звонит и с каким предположительно вопросом.

  • Идентификация абонентов - это голосовая биометрия (распознавание речи)

  • Идентификация намерений абонента (NLP). Здесь, на мой взгляд, есть смысл задать перечень вероятных намерений и относить конкретный звонок в один из классов возможных намерений.

Резюме - вот что нам требуется:

  1. технология голосовой биометрии (для телефонного канала)
  2. технология распознавания спонтанной речи (для телефонного канала)
  3. собственно модель для классификации намерения пользователей

Ответы (0 шт):