Рейтинг@Mail.ru

Искусственный интеллект Google научился читать по губам лучше людей

Катерина Лысенко, опубликовано 23 ноября 2016 г.

Рубрика: Новые технологии

Система искусственного интеллекта, созданная командой Google DeepMind, научилась понимать речь, следя за артикуляцией говорящего. Программа, читающая по губам, продемонстрировала в этой технике на 35% лучшие результаты, нежели профессиональный «считыватель» по губам.

Google

Систему искусственного интеллекта обучили на шести телешоу, выходивших за период с 2010 по 2015 гг. Так, программа проанализировала видео продолжительностью 5 тысяч часов. Проверка эффективности алгоритмов осуществлялась на новых выпусках телепрограмм, которые показывались с марта по сентябрь текущего года. Из 200 видеофрагментов человек смог безошибочно распознать лишь 12,4% произнесенных слов, а компьютерные алгоритмы – 46,8%. Полученные результаты могли быть гораздо лучше, если бы аудио и видео в некоторых видео не отставали друг от друга.

Ранее система ИИ превзошла человека на тесте GRID, словарный запас которого состоял из 51 уникального слова. Если сравнивать с ТВ-шоу BBC, таковых слов было произнесено 17 500. Программа вряд ли будет использована для прослушки, поскольку микрофоны направленного действия выполняют эту задачу намного лучше. Скорее всего, технологию будут использовать в потребительских устройствах.