Дополнение разделенной обработки алгоритмом многопотоковой архитектуры

Последние несколько десятилетий ознаменовали развитие технологий направленных слуховых аппаратов, которые обеспечили постепенное улучшение прослушивания речи в шумных ситуациях. Технология RealTime Conversation Enhancement от Signia с использованием многопоточной архитектуры была разработана для дальнейшего расширения преимуществ направленности в ситуациях динамического общения с несколькими собеседниками.

Петри Корхонен, магистр наук, и Кристофер Слугоцки, доктор философии

Хотя ассистивные слуховые технологии продемонстрировали преимущества технологии речи в шуме (SiN), прослушивание в шуме по-прежнему представляет собой проблему для слушателей с потерей слуха. Наш мир прослушивания редко бывает статичным. Звуковые сцены вокруг слушателя могут включать в себя множество партнеров по общению, движущихся и говорящих с разных сторон. Одновременно шум может исходить со многих направлений. Технологии слуховых аппаратов, которые отслеживают звуковую среду и адаптируют ее обработку для улучшения общения в таких акустически сложных ситуациях прослушивания, могут помочь решить эту проблему.

Сравнение одностороннего и двустороннего формирования луча 

Направленные микрофоны улучшают качество речи в шуме. Двухмикрофонные решетки, также известные как односторонние формирователи луча, объединяют сигналы двух всенаправленных микрофонов, расположенных внутри корпуса одного слухового аппарата, тогда как двусторонние двухмикрофонные решетки, также известные как двусторонние формирователи луча, объединяют сигналы с каждой стороны головы, эффективно используя всего четыре микрофона. Двусторонние формирователи луча обеспечивают еще более узкую зону фокусировки, чем это возможно при использовании системы направленного действия с двумя микрофонами, что еще больше помогает владельцам слуховых аппаратов следить за речью в акустически сложных условиях. Однако это преимущество узкой направленности может быть недостатком двусторонних формирователей луча.

Общение в реальной жизни не ограничивается разговорами один на один, когда собеседники смотрят друг на друга. Вместо этого нередко бывает, что несколько партнеров по общению говорят с разных сторон. Для двустороннего формирователя луча с очень узким лучом сообщения, произнесенные динамиками за пределами узкого луча, могут быть не слышны.

Кроме того, двусторонние формирователи луча медленно адаптируются к изменениям звуковой сцены, чтобы избежать резких изменений звука, и, таким образом, работают только тогда, когда фоновый шум стабилен. Чтобы преодолеть потенциальную потерю слышимости, слуховой аппарат должен иметь возможность быстро адаптировать свою диаграмму направленности, чтобы следовать за движущимися динамиками.

Добавление технологии разделенной обработки для улучшения отношения сигнал/шум

Такая потребность была решена благодаря внедрению технологии RealTime Conversation Enhancement (RTCE) компании Signia, реализованной с использованием многопоточной архитектуры (MSA)1, нового способа анализа и обработки групповых разговоров. RTCE включает технологию разделенной обработки, которая применяет различные настройки усиления и сжатия к сигналам спереди и сбоку/сзади.2 Кроме того, с помощью усовершенствованного бинаурального формирования луча создаются три независимых фокусных потока, которые добавляются к разделенному сигналу. поток обработки в переднем полуполе для захвата речи нескольких говорящих в разных направлениях1

Цель — сделать групповые разговоры в шуме проще и комфортнее за счет улучшения соотношения сигнал/шум (SNR), в том числе в тех случаях, когда слушатель не смотрит прямо на собеседника. Алгоритм сначала определяет расположение источников звука, чтобы определить, находятся ли они рядом с говорящими или они рассеяны и расположены дальше и, следовательно, не являются частью разговора.

Дополнительная информация: многопотоковая архитектура для повышения производительности диалога

Затем алгоритм выбирает наилучшую направленность, управляя и смешивая несколько фокусных потоков на основе результатов акустического анализа. Это обеспечивает улучшенное прослушивание и общение по сравнению с тем, что обеспечивается только разделенной обработкой. Анализ, положение фокусных потоков и уровень улучшения, обеспечиваемые быстрой широкополосной технологией «от уха к уху» (e2e), адаптируются 1000 раз в секунду в режиме реального времени, таким образом немедленно реагируя на любые изменения в разговор, чтобы обеспечить оптимальную обработку.

В этом исследовании была проведена попытка сравнить производительность RTCE с технологией разделенной обработки, не основанной на RTCE, при прослушивании двух собеседников.
Поскольку проблемы с общением могут распространяться на измерения, которые не могут быть отражены только с помощью показателей распознавания речи, например, когда прослушивание требует усилий, утомляет и вызывает стресс3, мы также измерили субъективный отчет об усилиях по прослушиванию и готовность слушателей оставаться в шума в дополнение к измерению порога восприятия речи (SRT).

Методы технического исследования RTCE

Участвовало восемнадцать взрослых (средний возраст = 72,8 лет, стандартное отклонение ±10,4; 9 женщин) с симметричной (в пределах ±15 дБ при частоте от 250 Гц до 4 кГц, за исключением двух участников с ±25 дБ на одной частоте) нейросенсорной тугоухостью. Среднее значение чистого тона по четырем частотам в двух ушах составило 49,2 дБ HL (SD = 10,0). Тринадцать слушателей имели опыт работы со слуховыми аппаратами >9 лет, а один слушатель имел опыт работы со слуховыми аппаратами

Мы адаптировали тест на повторение и припоминание (RRT)4 к сценарию, в котором два собеседника по очереди разговаривают в шуме. Мы оценили влияние RTCE на качество распознавания речи, усилие прослушивания и допустимое время прослушивания. Оценка усилий по прослушиванию количественно определяет необходимость распределения когнитивных ресурсов, таких как внимание, для понимания речи; косвенно отражающие трудности общения.

Под допустимым временем прослушивания понимается продолжительность, в течение которой слушатель готов продолжать слушать говорящего в определенных условиях тестирования. Было показано, что допустимое время коррелирует с толерантностью к шуму5 и с удовлетворенностью слуховым аппаратом в реальных шумных ситуациях6. Включение суждений об усилии прослушивания и допустимом времени в оценка рисует более полную картину мотивации слушателя продолжать общение в шумных ситуациях.

Тестирование проводилось с использованием синтаксически допустимых, но семантически бессмысленных (например, «Держи ледяные фрукты в ресторане») предложений RRT.7 Каждое предложение содержало три или четыре ключевых слова, используемых для оценки. Предложения чередовались в двух положениях (0° и 330°), чтобы приблизиться к прослушиванию двух собеседников, говорящих по очереди. Сигнал речевого дистрактора (ISTS) подавался под углом 150°, 180° и 210° при уровне звукового давления 75 дБ. Шум в кафетерии был представлен под углами 30°, 150°, 180° и 210° при уровне звукового давления 65 дБ (Рисунок 1).

Рис. 1. Тестовая установка с двумя говорящими на фоне фонового шума. по очереди.

Слушатели тестировались с использованием двусторонних слуховых аппаратов Signia Pure Charge&Go IX (HA), запрограммированных с двумя настройками: RTCE-OFF и RTCE-ON. Настройка RTCE-OFF включает технологию разделенной обработки, которая обрабатывает звуки спереди и сзади с использованием независимых настроек сжатия и шумоподавления в дополнение к адаптивным односторонним формирователям луча.

Настройка RTCE-ON включала технологию RealTime Conversation Enhancement (RTCE), которая создавала несколько фронтальных потоков фокусировки с использованием усовершенствованных двусторонних лучей, направляемых в направлении речи. Эти потоки фокусировки были добавлены к потоку фокусировки переднего полуполя с разделенной обработкой. ГК были соединены с помощью закрывающих ушных вкладышей и подогнаны по формуле подгонки Signia (IXFit).

Процедура

На этапе № 1 SNR, необходимый для 50% правильного порога приема речи на уровне предложений (SRT-50), оценивался с помощью адаптивной процедуры с использованием блоков по 20 предложений в условии RTCE-ON дважды. Записывались усредненные результаты.

На этапе № 2 качество речи в шуме каждого слушателя измерялось при SNR, соответствующем SRT-50, измеренному на этапе № 1. Качество распознавания предложений (% правильно повторенных) измерялось с использованием трех предложений по 20 предложений. блоки от ГБР в уравновешенном порядке. После каждого блока из 20 предложений участников просили оценить, насколько сложной для них была ситуация прослушивания, по 10-балльной шкале, охватывающей «минимальное усилие» (= 1), «умеренное усилие» (= 5) и «очень трудоемкое прослушивание». (=10).
Слушатели также оценили, сколько времени (в минутах) они готовы потратить на прослушивание в таких шумных условиях.

Результаты исследования

Рис. 2. Распределение SNR, соответствующее производительности 50 % (SRT- 50) с RTCE-ON.

Показания SRT-50, измеренные с помощью RTCE-ON, находились в диапазоне от -9,7 до 10,1 дБ (среднее значение = -1,4 дБ, стандартное отклонение = 5,1 дБ), при этом 12 из 18 слушателей имели SRT-50 Рисунок 2). ). Примечательно, что SNR ниже 0 дБ можно охарактеризовать как «очень шумные».8 Таким образом, большинству участников с умеренной и тяжелой потерей слуха требуется только SNR

Результаты распознавания речи

Рис. 3. Распознавание речи (в %), измеренное с помощью RTCE-OFF и RTCE-ON в предложениях RRT. Столбики ошибок представляют собой 95% доверительные интервалы внутри субъекта (***p

На рисунке 3 показано, что эффективность распознавания предложений при использовании RTCE-ON была на 8,2 % выше, чем при использовании RTCE-OFF (p

Влияние на качество прослушивания

Рис. 4. Субъективные оценки усилий по прослушиванию (по 10-балльной шкале) измерено с помощью RTCE-OFF и RTCE-ON. Столбики ошибок представляют собой 95% доверительные интервалы внутри субъекта (*p

На рисунке 4 показано, что участники оценили усилие прослушивания при использовании RTCE-ON значительно ниже, чем при RTCE-OFF (p9 Это может ускорить понимание и повысить готовность слушателя участвовать в общении и социальной деятельности3суп>

Допустимое время прослушивания

Рис. 5. Допустимое время прослушивания (в минутах), измеренное с помощью RTCE-OFF и RTCE-ON. Столбики ошибок представляют собой 95% доверительные интервалы внутри субъекта (**p

Прямым следствием снижения усилий при прослушивании также может быть готовность слушателей проводить больше времени в шуме с RTCE-ON, чем с RTCE-OFF (28 минут против 22 минут) (Рисунок 5). 6-минутное увеличение было значительным (p10

Обсуждение

Новая технология RealTime Conversation Enhancement (RTCE) от Signia с многопоточной архитектурой (MSA) улучшила разборчивость речи участников, снизила их усилия по прослушиванию и увеличила время, в течение которого они были готовы участвовать в общении, по сравнению с технологией без RTCE. .

Важно отметить, что улучшения, предложенные RTCE, превосходили преимущества разделенной обработки.
По сравнению с адаптивными направленными микрофонами с одним потоком, разделенная обработка улучшает соотношение сигнал/шум11, улучшает разборчивость речи2 и повышает устойчивость к шуму12sup>, усиливают контраст между звуками в звуковом ландшафте пользователя, согласно индексу MMN13, и уменьшают усилие при прослушивании, измеряемое с помощью альфа-ЭЭГ активности14

По сравнению с разделенной обработкой, технология RTCE еще больше расширяет преимущества направленности для динамических ситуаций прослушивания с более чем одним собеседником. Более того, поскольку RTCE постоянно анализирует звуковые сцены вокруг слушателя, он корректирует интересующие направления, когда слушатели меняют свое положение. Это может позволить слушателям двигаться более свободно, сохраняя при этом слышимость.

Новая технология RTCE еще больше расширяет преимущества разделения речи в шуме на ситуации динамического общения с несколькими собеседниками. Текущее исследование показывает, что RTCE облегчает слушателям понимание и участие в разговоре. Более того, результаты могут повлиять на то, как специалисты по слухопротезированию оценивают потребности пациента в слухе, включая, возможно, добавление усилий по прослушиванию и мер по принятию шума в свою клиническую практику при выдаче слуховых аппаратов.

Об авторах: Петри Корхонен, магистр наук, — старший научный сотрудник, и Кристофер Слугоцки, доктор философии, — научный сотрудник Аудиологического отдела исследований в области клинической амплификации (ORCA) в Лайле, штат Иллинойс. >

Графики предоставлены Signia.

Главное фото: «Время мечтаний»

Ссылки

Дженсен Н.С., Самра Б., Парси Х.К., Билерт С., Тейлор Б. Многопотоковая архитектура для повышения производительности диалога. Просмотр слушания. 2023;30(10):20-23.

Йенсен Н.С., Хойдал Э.Х., Бранда Э., Вебер Дж. Расширение распознавания речи с помощью новой парадигмы разделенной обработки. Просмотр слушания. 2021;28(6):24-27.

Пичора-Фуллер М.К., Крамер С.Е., Эккерт М.А. и др. Нарушение слуха и когнитивная энергия: основа понимания слушания с усилием (FUEL). Ухо, слышите. 2016;37 Приложение 1:5S-27S.

Слугоцки С., Кук Ф., Корхонен П. Разработка и клиническое применение теста повторения и припоминания ORCA (RRT). Просмотр слушания. 2018;25(12):22-27.

Кук Ф., Слугоцки С., Корхонен П. Характеристики теста на быстрое повторное припоминание (Q-RRT). Int J Aud. 2023:1–9.

Сепер Э., Кук Ф., Корхонен П., Слугоцки К. Отслеживание толерантности к шуму для прогнозирования удовлетворенности слуховым аппаратом в громкой шумной обстановке. J Am Acad Audiol. 2019;30(4):302-314.

Кук Ф., Слугоцкий С., Корхонен П. Показатели пожилых слушателей с нормальным слухом в тесте на отслеживание толерантности к шуму (TNT). Int J Aud. 2023:1–8.

Ву Ю.Х., Штангл Э., Чипара О., Хасан С.С., Велхейвен А., Олесон Дж. Характеристики реальных отношений сигнала к шуму и ситуаций прослушивания речи пожилых людей с легкой и умеренной потерей слуха. Ухо, слышите. 2018;39(2):293-304.

Эдвардс Б. Модель слухо-когнитивной обработки и ее значение для клинического применения. Ухо, слышите. 2016;37 Приложение 1:85S-91S.

Смедс К., Уолтерс Ф., Рунг М. Оценка отношения сигнал/шум в реалистичных звуковых сценариях. J Am Acad Audiol. 2015;26(2):183-96.

Корхонен П., Слугоцки С., Тейлор Б. Исследование показывает, что разделенная обработка сигналов Signia значительно улучшает соотношение сигнал/шум. АудиологияОнлайн. 2022;Статья 28224.

Кук Ф., Слугоцки С., Дэвис-Руперто Н., Корхонен П. Измерение влияния адаптивной направленности и разделенной обработки на восприятие шума на нескольких уровнях входного сигнала. Int J Aud. 2023;62(1):21-29.

Слугоцки С., Кук Ф., Корхонен П., Руперто Н. Использование отрицательного рассогласования (MMN) для оценки разделенной обработки в слуховых аппаратах. Просмотр слушания. 2021;28(10):20-23. 14. Слугоцки С, Корхонен П. Сплит-обработка в слуховых аппаратах уменьшает нейронные сигнатуры прослушивания речи в шуме. Просмотр слушания. 2022;29(4):20, 22–23.
ол>

Оригинальная ссылка на эту статью: Корхонен П., Слугоцки С., Расширение разделенной обработки с помощью алгоритма многопоточной архитектуры. Просмотр слушания. 2024;31(5):20-25.

Анонсы наших новых статей в Телеграме

Read More

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Антиспам *Капча загружается...