Голосовая биометрия и определение намерений пользователя: какие подходы и где взять датасет?

Автор вопроса: Алексей Казанцев

В рамках написания дипломной работы по машинному обучению есть тема из реальной практики. Если кратко, это звонки в службу поддержки (см. ниже). Ищу идеи, какие могут быть реализации. Также интересуют датасеты для обучения алгоритма (реальных звонков в службу поддержки нет, значит, надо найти анонимизированную базу либо создать свою - по нескольку десятков голосов на каждую из тем обращений клиентов: как это сделать?)

Описание

В контакт-центр поступает множество обращений. Необходимо автоматизировать процесс идентификации абонентов для уменьшения времени консультации (тематика - услуги связи, ТВ, домфона). Для этого требуется разработать сервис, способный по первым фразам человека определять, кто звонит и с каким предположительно вопросом.

Идентификация абонентов - это голосовая биометрия (распознавание речи)
Идентификация намерений абонента (NLP). Здесь, на мой взгляд, есть смысл задать перечень вероятных намерений и относить конкретный звонок в один из классов возможных намерений.

Резюме - вот что нам требуется:

технология голосовой биометрии (для телефонного канала)
технология распознавания спонтанной речи (для телефонного канала)
собственно модель для классификации намерения пользователей

Источник

БЛОГ НА HUSL

Голосовая биометрия и определение намерений пользователя: какие подходы и где взять датасет?

Ответы (0 шт):