Новые наушники на базе искусственного интеллекта «отменяют» только нежелательные звуки
Резюме. Исследователи из Вашингтонского университета разработали наушники с искусственным интеллектом, которые избирательно подавляют нежелательные звуки, сохраняя при этом нужные.
Выводы:
Наушники с шумоподавлением могут стать настоящей находкой для жизни и работы в шумной обстановке. Они автоматически распознают фоновые звуки и подавляют их, обеспечивая столь необходимую тишину и покой. Однако обычное шумоподавление не позволяет отличить нежелательные фоновые звуки от важной информации, в результате чего пользователи наушников не осознают происходящее вокруг.
Шьям Голлакота из Вашингтонского университета — эксперт по использованию инструментов искусственного интеллекта для обработки звука в реальном времени. Его команда создала систему целенаправленного прослушивания речи в шумной обстановке и разработала наушники на базе искусственного интеллекта, которые избирательно фильтруют одни звуки, сохраняя при этом другие. Он представил свою работу в рамках совместного заседания Акустического общества Америки и Канадской акустической ассоциации, проходившего 13–17 мая в Центре Шоу, расположенном в центре Оттавы, Онтарио, Канада.
Дополнительная литература: легкие лягушек действуют как наушники с шумоподавлением
"Представьте, что вы находитесь в парке и любуетесь звуками щебетания птиц, но затем слышите громкую болтовню группы людей поблизости, которые просто не могут перестать говорить", — говорит Голлакота. «А теперь представьте, что ваши наушники могут дать вам возможность сосредоточиться на звуках птиц, в то время как остальной шум просто исчезнет. Именно этого мы и хотели достичь с помощью нашей системы».
Голлакота и его команда объединили технологию шумоподавления с нейронной сетью на базе смартфона, обученной распознавать 20 различных категорий звуков окружающей среды. К ним относятся будильники, плач младенцев, сирены, автомобильные гудки и пение птиц. Когда пользователь выбирает одну или несколько из этих категорий, программное обеспечение идентифицирует и воспроизводит эти звуки через наушники с искусственным интеллектом в режиме реального времени, отфильтровывая все остальное.
Однако обеспечить бесперебойную работу этой системы было непростой задачей.
«Чтобы достичь того, чего мы хотим, нам сначала понадобился интеллект высокого уровня, который мог бы распознавать все различные звуки в окружающей среде», — говорит Голлакота. «Затем нам нужно было отделить целевые звуки от всех мешающих шумов. Если это недостаточно сложно, любые звуки, которые мы извлекали, необходимо синхронизировать со зрительными ощущениями пользователя, поскольку он не может услышать кого-то с опозданием на две секунды. Это означает, что алгоритмы нейронной сети должны обрабатывать звуки в реальном времени менее чем за сотую долю секунды, и именно этого мы и добились».
Команда применила этот подход на основе искусственного интеллекта, чтобы сосредоточиться на человеческой речи. Опираясь на аналогичные методы распознавания контента, их алгоритм может идентифицировать говорящего и изолировать его голос от окружающего шума в режиме реального времени, обеспечивая более четкую речь.
Голлакота говорит, что он рад быть в авангарде аудиоустройств следующего поколения: «У нас есть уникальная возможность создать будущее интеллектуальных наушников, которые смогут улучшить слух человека и увеличить его интеллект, чтобы сделать жизнь лучше».
Рекомендуемое изображение. Исследователи дополнили наушники с шумоподавлением нейронной сетью на базе смартфона, чтобы распознавать окружающие звуки и сохранять их, одновременно фильтруя все остальное. Фото: Шьям Голлакота
Анонсы наших новых статей в Телеграме