Система голосовой верификации пользователей с точностью распознавания 99%

У людей и компаний, которые все активнее пользуются корпоративными продуктами компании, постоянно растут требования к безопасности личных данных. Компания воспользовалась нашей разработкой, чтобы внедрить идентификацию по голосу в одном из своих продуктов

Шаг 1 — поставили задачу

Клиент хотел получить систему, которая бы позволяла пользователям авторизовываться с помощью голоса. При этом важно было соблюсти высокие требования к скорости и точности распознавания

Шаг 2 — выбрали технологию и разработали решение

Решили использовать нейросеть для распознавания коротких голосовых сообщений и подобрали архитектуру с учетом специфики проекта. Принцип простой: при авторизации голос преобразуется в вектор и затем сравнивается с хранящимся на сервере образцом по косинусному расстоянию. В результате мы получаем значение близости двух слепков и делаем вывод: принадлежат ли образцы одному человеку

Unsupervised обучение — общая нейросеть была предварительно обучена на данных, предоставленных клиентом, что позволило адаптировать модель под особенности различных источников звука и каналов передачи

Supervised обучение — на следующем этапе модель была откалибрована с использованием разметки голосов, чтобы настроить пороги классификации и повысить точность. Это позволило системе успешно распознавать принадлежность голосов к конкретным пользователям

Когда решение было готово, мы приступили к обучению модели:

Сперва мы проводили закрытое тестирование своими силами. Получили настолько хорошие результаты, что нам не поверили и решили, что мы подтасовываем данные. Поэтому мы подняли Web API с биометрией, чтобы они могли самостоятельно провести тестирование. Когда они провели повторное тестирование уже сами, все наши результаты подтвердились, и они приняли решение о покупке системы

При проверке на данных, которые не участвовали в обучении, мы получили следующие результаты: при уровне false positive 0,1% полнота алгоритма оказалась выше 90%

Интеграцией наша команда не занималась, мы передали полностью готовое коробочное решение

Результаты

Благодаря скорости и точности решения мы получили от заказчика позитивный фидбэк. Решение разработано с заделом на быструю интеграцию в различные системы с помощью API-коннектора

Точность распознавания выше 99%

Среднее время распознавания всего 8 секунд

Мы достигли обеих ключевых метрик, которые озвучивал клиент:

Свяжитесь с нами

Соцсети

Если у вас остались вопросы, напишите нам или оставьте заявку, и мы поможем с вашим вопросом

Связаться

Youtube

nikita.kifiiak@genai-lab.ru