Преимущества линейного снижения частоты для музыки

Успешные подходы к сохранению гармоник в музыкальных программах позволяют сохранить одинаковое общее звучание музыки для людей с плохим слухом.

Маршалл Чейзин, AuD; Дэйв Фабри, доктор философии; и Фрэнсис Кук, доктор философии

Хотя снижение частоты было полезно для обеспечения слышимости более высокочастотных согласных для людей со значительной потерей слуха на высоких частотах, из этого не обязательно следует, что это также будет полезно для музыки. (1) Для речи снижение частоты до более здорового часть улитки может быть очень полезной, и причина, по которой это сработает, заключается в том, что речь имеет только высокочастотные диапазоны энергии с пониженной частотой. Эти широкие полосы высокочастотной энергии встречаются во всех шумных звуках, таких как /s/, /f/, и на самом деле не имеет значения, начинается ли широкая полоса энергии шипящих с 4000 Гц или 3800 Гц.

Конечно, слишком сильное понижение частоты может привести к некоторой путанице согласных, например, /s/ можно спутать с /sh/. На более низких частотах в речи преобладают сонорные звуки, такие как гласные и носовые. Соноранты состоят из равноотстоящих друг от друга гармоник, а не из широких полос источников шума. Изменение любой из гармоник приведет к тому, что речь будет звучать «грубо» и странно. Следовательно, понижение частоты не будет работать для более низких частот речи.

Однако инструментальная музыка состоит только из гармоник. Это справедливо как для более низких частот (например, речи), так и для более высоких частот (в отличие от речи). Даже малейшее понижение гармоники в музыке может вызвать диссонанс. (2) На рисунке 1 показан спектр, в котором все гармоники выше 1500 Гц понижены всего на половину полутона. Исходный звук этой скрипки показан красным, а гармоники с пониженной частотой - черным. Также включены QR-коды для трех аудиофайлов: один со скрипкой, играющей одну ноту (ля [440 Гц]), второй с полной оркестровой музыкой и третий с речью. Все они представлены в формате ABA, где A — исходный (красный), а B — небольшое понижение высоких частот (черный). Обратите внимание, что третий файл речи по-прежнему звучит нормально.

Рис. 1. Все гармоники выше 1500 Гц понижены всего на половину полутона. Исходный звук скрипки показан синим цветом, а гармоники с пониженной частотой — белым.

Устранение мертвых зон улитки

Понижение частоты музыки, по крайней мере на начальном этапе, не является действенной клинической стратегией для музыкальной программы для пациентов, которым необходимо избегать мертвых зон улитки. Однако одна из клинических стратегий заключалась в уменьшении амплитуды высокочастотных гармоник. В этом сценарии точная частота гармоник не изменилась; только их амплитуды. Спектры показаны на Рисунке 2, стрелка указывает на измененный спектр, который был уменьшен на -6 дБ/октаву только выше 1500 Гц. Соответствующий аудиофайл также имеет формат ABA. (Чтобы услышать, отсканируйте QR-код рядом с рис. 2.)

Как отметил Фрэнсис Кук (в книге «Подход Widex» ниже), было обнаружено, что некоторая звуковая энергия в «мертвой зоне улитки» все еще может быть полезной. Похоже, что вредное воздействие усиленной музыки в частотной области со значительным повреждением улитки зависит от уровня, причем более низкие уровни более приемлемы. Однако есть еще одна стратегия, которая может быть полезна нашим пациентам, чтобы они могли слушать и/или воспроизводить музыку, несмотря на значительное повреждение улитки, и при этом сохранять хорошую точность воспроизведения.

Понижение частоты может иметь линейную или нелинейную функцию. Под «линейным» мы подразумеваем, что все более высокочастотные гармоники (выше определенной точки) понижаются одинаково на одну и ту же величину, и они понижаются таким образом, что все более высокочастотные гармоники отображаются на уже существующие более низкочастотные гармоники.
Если посчитать, то этого можно добиться, если линейное понижение частоты составляет ровно одну октаву: 4000 Гц отображается на 2000 Гц, 8000 Гц отображается на 4000 Гц и так далее.

Дополнительная литература: Характеристики частотной характеристики слухового аппарата для музыки

Все гармоники с пониженной частотой отображаются на уже существующие гармоники. Но кроме того, гармоники с нечетными номерами отображаются на частотах, которые не будут звучать диссонансно. Для музыкальных инструментов с резонатором ½ длины волны, таких как гитара, фортепиано и скрипка, создается идеальная пятая часть (например, до, создающая не только до на октаву ниже, но и промежуточную соль). Идеальная квинта — это не то, что имел в виду композитор, но она по-прежнему звучит гармонично. Для музыкальных инструментов с четвертьволновым резонатором, таких как кларнет и труба, создаются терции, которые, опять же, не были тем, что имел в виду композитор, но все равно звучали бы гармонически приятно. На рисунке 3 показан спектр такого линейного понижения частоты, при котором создается идеальная квинта (ми) (красные гармоники, которые равномерно распределены между уже существующими гармониками) при воспроизведении ноты ля (черные гармоники).

Слуховые аппараты, в которых используется схема нелинейного снижения частоты, нельзя использовать для какой-либо музыки, кроме вокала.

Подходы к снижению частоты

В настоящее время в индустрии слуховых аппаратов существует три основных подхода к снижению частоты:

ПЕРЕМЕЩЕНИЕ ЧАСТОТЫ: линейное уменьшение, которое можно рассматривать как подход «вырезать/скопировать и вставить». Примером может служить расширитель слышимости Widex.

ПЕРЕВОД ЧАСТОТЫ: линейное искажение огибающей спектра, которое можно рассматривать как подход «копировать и вставить». Примером может служить спектральный IQ Старки.

SOUND RECOVERY: нелинейное частотное сжатие.
ол>

Несмотря на использование различных линейных алгоритмов, преобразование частоты с помощью Widex (метод вырезания/копирования и вставки) и преобразование частоты с помощью Starkey (метод копирования и вставки), если установлено понижение частоты ровно на одну октаву, может быть очень полезным. в музыкальной программе для наших слабослышащих пациентов. Учитывая, что в индустрии слуховых аппаратов разрабатываются все алгоритмы, было бы полезно расслабиться и узнать больше о том, как принимаются такие проектные решения.

Ниже приведены два обзора полезности и развития этих двух подходов к линейному снижению частоты. Дэйв Фабри, доктор философии, расскажет о линейном преобразовании частот Starkey Spectral IQ, а Фрэнсис Кук, доктор философии, обсудит линейное преобразование частот Widex Audiibility Extender.

Дополнительная литература: борьба с музыкой и стрессом

Подход Старки

В 2011 году компания Starkey представила свою стратегию снижения частоты, первоначально называвшуюся Spectral iQ, в слуховых аппаратах серий X и Wi.

Алгоритм Spectral iQ предназначен для использования в случаях тяжелой и глубокой, высокочастотной, наклонной потери слуха. Этот новый метод снижения частоты технически описывается как искривление спектральной огибающей (SEW).(3)

Алгоритм SEW отслеживает высокочастотные области на наличие спектральных пиков, которые отвечают за распознавание высокочастотных звуков речи, таких как /s/ и /sh/. Алгоритм характеризует форму высокочастотного спектра и динамически воссоздает эту спектральную форму внутри целевой области более низкой частоты. Исходная область для анализа, целевая область для вновь созданного спектрального сигнала и усиление, применяемое к вновь созданному сигналу, задаются программным обеспечением.

В отличие от подходов к нелинейному частотному сжатию, которые могут повлиять на гармонию, алгоритм SEW использует линейное предсказание для разработки резонансного фильтра таким образом, чтобы он НЕ влиял на гармонию. Это особенно важно для музыки, поскольку пониженные компоненты сохраняют гармоническую структуру, не влияя на артефакты и искажения.

Рис. 4.
Блок-схема системы системы снижения частоты Starkey

Рис. 5. Функция деформации спектральной огибающейфигура>

Эта стратегия обработки сигнала идентифицирует высокочастотные спектральные сигналы и генерирует дополнительный сигнал на более низкой слышимой частоте, чтобы улучшить слышимость высокочастотных звуков, которые ранее были неслышимы для пользователя слухового аппарата. Мы ожидали, что генерация нового сигнала, а не понижение звука и сопутствующего шума, минимизирует негативно воспринимаемые изменения качества звука, присущие процессу введения новой информации на частотах, которые ранее не содержали этой информации.

Дополнительная литература: Помощь реципиентам кохлеарного имплантата в улучшении их отношений с музыкой

Подход Widex

Впервые компания Widex представила линейное преобразование частоты в 2006 году (4) под названием Расширитель слышимости (AE). Алгоритм «обрезает» выходной спектр выше частоты среза (начальной частоты) и «вставляет» его на одну октаву вниз, чтобы транспонированные гармоники более высоких частот совпадали с усиленными гармониками более низкой частоты. Оригинальный AE был задуман тогдашним главным инженером Хеннингом Андерсеном, аудиофилом, который придает исключительное значение сохранению естественного качества всех звуков. Вместе с Карлом Людвигсеном, в то время главным аудиологом Widex, Хеннинг сделал сохранение естественности звука краеугольным камнем всех алгоритмических разработок в Widex, вплоть до сегодняшнего дня.

В 2017(5) AE был обновлен до своей нынешней формы в слуховом аппарате Widex BEYOND. Его можно рассматривать как подход «вырезать то, что вам нужно, и вставить», при котором транспонированная октава (звука) вставляется в усиленный выходной спектр, который выходит за пределы начальной частоты на индивидуальную величину. Улучшенный AE разработан на основе концепции Effortless Hearing. Новые функции отражают то, как когнитивные факторы учитываются в процессе улучшения, поэтому люди с любым когнитивным уровнем могут получить максимальную выгоду от их использования. Для тех, кто хочет углубиться в эту тему, статья Кука и др. «Расширитель слышимости: использование когнитивных моделей для проектирования слухового аппарата с понижением частоты» в Hearing Review содержит более подробную информацию об обосновании конструкции и особенностях.

Вкратце, современные когнитивные модели предполагают, что слушателям сложнее адаптироваться к новым транспонированным звукам, если они больше отличаются от исходных нетранспонированных звуков. Это говорит о том, что в зависимости от слушателей может быть более приемлемо сначала начать транспозицию с более полной полосой пропускания (меньшее отличие от исходного звука) и постепенно уменьшать полосу пропускания (большая разница с исходным звуком), чтобы облегчить переход.

Недавние исследования также поставили под сомнение то, какая часть «мертвой» высокочастотной области может быть усилена. Ранее считалось, что все частоты в мертвой зоне (или выше начальной частоты) следует транспонировать, а не усиливать. В ходе внутреннего исследования мы обнаружили, что слушатели с непреодолимой потерей высоких частот на самом деле предпочитают иметь выходную полосу пропускания, простирающуюся до «мертвой» области. Степень желательного расширения варьировалась среди слушателей: от отсутствия расширения до полной полосы пропускания. Однако большинство слушателей предпочли расширить полосу пропускания менее чем на одну октаву, больше для прослушивания музыки, чем для понимания речи.

Эти новые результаты показывают, что полоса пропускания усиленного спектра, к которому добавляется транспонированный спектр, может иметь решающее значение для успеха слушателя при линейном транспонировании. Таким образом, текущий AE имеет переменный диапазон выходных частот (OFR), который позволяет врачу задавать полосу усиления в режиме AE от начальной частоты до полной полосы пропускания 10 кГц с интервалом в одну треть октавы. Это позволяет индивидуализировать оптимальную полосу пропускания на основе предпочтений слушателя, опыта работы с AE или размера «мертвой» зоны.

Чтобы еще больше обойти потенциальное возникновение рассогласования гармоник и сохранить естественность транспонированных звуков, в текущую версию AE включен трекер гармоник. Этот автоматический алгоритм отслеживает гармоники транспонированных звуков, чтобы убедиться, что они идеально совпадают с исходными звуками и минимизировать эхо-артефакты.

АЕ также использует детектор речи, чтобы различать звонкие (во всех каналах) и глухие (только выше 2000 Гц) звуки.
При обнаружении звука вокализованной речи он транспонируется с более низким уровнем усиления AE, чем при обнаружении невокализованного звука, который транспонируется с максимальным усилением AE. Это сведет к минимуму любую маскировку транспонированным вокализованным звуком в целевой области и увеличит выразительность невокализованных транспонированных звуков. Как правило, транспонированные звуки усиливаются, поэтому их уровень примерно на 5–10 дБ превышает потерю слуха на этой частоте.

Чтобы постепенно облегчить слушателям восприятие транспонированных звуков, AE имеет функцию акклиматизации усиления AE. После активации целевое усиление AE снижается на 6 дБ во время настройки только для автоматического увеличения с шагом ½ дБ в день, поэтому полное целевое усиление AE восстанавливается через 12 дней после настройки. Это сводит к минимуму количество начальных несоответствий и облегчает (менее трудоемко) восприятие звуков АЭ. Также особое внимание уделяется обучению эффективному использованию этой функции.

Подводя итог, можно сказать, что подход Widex к использованию линейного преобразования частоты и функции расширителя слышимости Widex, а именно отслеживание гармоник, детектор речи, гибкий диапазон выходных частот и стартовая частота, а также алгоритм акклиматизации расширителя слышимости, повышают вероятность первоначального соответствие между транспонированными звуками и фонологическими представлениями в долговременной памяти слушателя. Это сводит к минимуму необходимость явной обработки и может принести пользу людям с любым когнитивным уровнем.

Маршалл Чейсин, доктор медицинских наук, аудиолог и директор по слуховым исследованиям в Музыкальных клиниках Канады, адъюнкт-профессор Университета Торонто и адъюнкт-профессор Западного университета. Вы можете связаться с ним по адресу marshall.chasin@rogers.com.

Дэйв Фабри, доктор философии, является главным специалистом по слухопротезированию в компании Starkey, где он работает с 2009 года. Ранее он занимал должности в Медицинском центре Университета Майами, клинике Мэйо и Армейском медицинском центре Уолтера Рида. В прошлом он был президентом и членом правления Американской академии аудиологии, а в настоящее время входит в состав правления Американского слухового общества. Он проживает в Иден-Прери, штат Миннесота.

Фрэнсис Кук, доктор философии, получил степень доктора аудиологии в Университете Айовы в 1986 году. Он занимал должности сотрудников и преподавателей в Университете Айовы и Университете Иллинойса-Чикаго соответственно. В настоящее время он является вице-президентом по клиническим исследованиям в Widex. Он много писал и выступал в области технологий и приспособлений для слуховых аппаратов. Он также является редакционным консультантом различных профессиональных журналов.

Оригинальная ссылка на эту статью: Часин М.; Фабри Д.; и Кук Ф., Преимущества линейного снижения частоты для музыки. Просмотр слушания. 2024;31(1):08-13.

Ссылки:

Чейсин М. Частотное сжатие предназначено для речи, а не для музыки. Обзор слуха. 2016;23(6):12.

Часин М. Музыка и слуховые аппараты. Сан-Диего, Калифорния: Plural Publishing Group; 2022.

Фитц К., Эдвардс Б. и Баскент Д. Преобразование частот за счет высокочастотного искажения спектральной огибающей в слуховых аппаратах. 2014. Патент США № US8761422B2.

Кук Ф., Корхонен П., Питерс Х., Кинан Д., Джессен А. и Андерсен Х. Линейное преобразование частоты: расширение слышимости высокочастотной информации. Обзор слуха. 2006;13(10):42-48.

Кук Ф., Сепер Э. и Корхонен П. Расширитель слышимости: использование когнитивных моделей для проектирования слухового аппарата с понижением частоты. Обзор слуха. 2017;24(10):26-34.
ол>

Анонсы наших новых статей в Телеграме

Блог о здоровье