Signia Integrated Xperience (IX) ha introducido la tecnología RealTime Conversion Enhancement para ayudar a los usuarios a participar en conversaciones de grupo ruidosas. Con el apoyo de un análisis avanzado de la escena sonora y una arquitectura única multi-stream, los usuarios de Signia IX pueden seguir y contribuir en las conversaciones en todas las situaciones dinámicas y ruidosas. En este artículo, actualizamos un estudio anterior para incluir las últimas versiones de 2024 de los principales competidores en una comparación técnica de Signia IX y los 4 audífonos principales de la competencia en una conversación de grupo dinámica simulada con ruido de fondo. Se observó una clara ventaja de 3,2 dB en la relación señal/ruido para Signia IX. Esto significa que Signia IX ofrece más del doble de beneficios de mejora del habla en una conversación de grupo ruidosa que los competidores más cercanos, incluidas las plataformas con coprocesador de IA.
Niels Søgaard Jensen, Cecil Wilson, Homayoun Kamkar Parsi, Barinder Samra, Jens Hain, Sebastian Best, Brian Taylor
OCTUBRE 2024
Se sabe que una de las consecuencias más notables e importantes de la pérdida de audición es la disminución de la capacidad de entender a otras personas que hablan en entornos ruidosos. Por ello, una de las tareas más importantes de un audífono es proporcionar la capacidad de entender el habla en ruido y, por tanto, de participar en conversaciones con ruido de fondo. En una encuesta realizada a casi 15.000 personas, la gran mayoría con pérdida auditiva declarada, «oír a amigos y familiares en ruido» resultó ser el atributo más deseable de un audífono, con un 88,3% de los encuestados que calificaron este atributo como muy o extremadamente importante (Manchaiah et al., 2021).
Con cada nueva generación de tecnologías Signia de mejora del habla y reducción del ruido, se ha renovado el interés por equilibrar la mejora de la comprensión del habla en ruido con la conciencia del sonido en el entorno del usuario.
Con nuestra última innovación, Signia Integrated Xperience (IX) con RealTime Conversation Enhancement (RTCE), Signia ha dado un gran salto adelante. En lugar de simplemente mejorar la capacidad de comprensión del habla en una escena acústica estática en la que el interlocutor de interés está frente al usuario del audífono, los avances en el análisis en tiempo real y el procesamiento de escenarios de conversación ahora mejoran toda la experiencia del usuario en conversaciones dinámicas de grupo con ruido de fondo. El análisis de la escena y el efecto combinado del exclusivo procesamiento dividido -que permite procesar por separado el habla y el ruido- y el nuevo enfoque de procesamiento multistream de RTCE proporcionan al usuario la capacidad de participar plenamente en la conversación y contribuir en ella, al tiempo que se sumerge por completo en el entorno.
El rendimiento clínico y las ventajas de Signia IX con RTCE ya se han demostrado en una amplia variedad de estudios. La exclusiva arquitectura multi-stream de Signia IX requiere estudios con múltiples hablantes dinámicos para mostrar plenamente sus capacidades. Creemos que estas configuraciones de prueba son cruciales para el avance de la industria más allá de las simples comparaciones con altavoces estáticos individuales en ruido. Nuestro objetivo es promover metodologías de prueba realizadas en entornos reales o diseñadas para reflejar mejor las realidades conversacionales de nuestros usuarios.
Entre los estudios de Signia IX, mencionaremos algunos recientes. Investigadores de la Universidad de Ontario Occidental probaron el efecto de la RTCE en un escenario real de conversación ruidosa en grupo en un concurrido patio de comidas. Descubrieron altos niveles de satisfacción auditiva y una preferencia significativa por la RTCE en conversaciones reales (Folkeard et al., 2024). Los investigadores de ORCA-USA han publicado los resultados de un estudio de rendimiento humano en el que se ha comprobado una mejor comprensión del habla, una mayor tolerancia al ruido y una reducción del esfuerzo auditivo autodeclarado con RTCE (Korhonen & Slugocki, 2024). Los investigadores también realizaron mediciones objetivas de EEG que sugieren que el RTCE reduce el esfuerzo de escucha (Slugocki et al., 2024).
Anteriormente se había realizado una evaluación técnica en un escenario dinámico con varios interlocutores (Jensen et al., 2023b). En ese estudio se investigó el aumento de la relación señal-ruido (SNR) -es decir, la capacidad del audífono para realzar el habla por encima del ruido- proporcionado por Signia IX y cuatro competidores clave en una conversación dinámica de grupo en ruido. Mejorar la relación señal/ruido (SNR) es obviamente uno de los requisitos más importantes para mejorar la comprensión del habla en ruido. En esta comparación, Signia IX proporcionó una SNR 3,2 dB superior a la del mejor de los competidores. Esta diferencia sustancial puede explicarse por las filosofías de procesamiento dividido y de procesamiento de múltiples flujos aplicadas en los audífonos Signia IX, mediante las cuales el habla se procesa y mejora independientemente de la reducción de ruido, y los múltiples haces binaurales se adaptan continuamente al entorno de la conversación. Por el contrario, los audífonos de la competencia utilizaban el procesamiento tradicional de flujo único, en el que la reducción de ruido puede afectar a la claridad del habla, ya que el habla y el ruido se procesan conjuntamente.
Desde la finalización del estudio SNR, algunos competidores clave han lanzado nuevos productos con tecnologías como la reducción de ruido basada en redes neuronales profundas (DNN). Sin embargo, estos productos siguen basándose en el mismo procesamiento fundamental de flujo único, lo que puede limitar su capacidad para gestionar de forma independiente el habla y el ruido.
Aunque los competidores han publicado datos que destacan las ventajas de sus nuevos productos, no los han probado en un entorno dinámico con varios interlocutores que refleje las conversaciones de la vida real. Para ver cómo los audífonos de la competencia se comparan con Signia IX en un escenario que refleja una conversación de grupo ocupada, actualizamos nuestro estudio original para incluir estos productos más nuevos.
El objetivo de la investigación era evaluar el rendimiento de SNR de los distintos audífonos en un escenario de conversación dinámica con varios interlocutores que se turnaban, en contraposición a una configuración más estática con un único interlocutor al frente.
Método Hagerman
La investigación se basó en la técnica de inversión de fase de Hagerman, ampliamente reconocida y propuesta originalmente por Hagerman y Olofsson (2004). Este método permite evaluar los sistemas de reducción de ruido de los audífonos cuando el habla y el ruido están presentes al mismo tiempo. Al grabar la señal combinada (habla y ruido) en el lado de salida del audífono, con y sin inversión de fase de las señales de entrada, la metodología permite aislar el habla procesada y el ruido procesado. Al promediar las señales del habla y del ruido, respectivamente, es posible proporcionar una estimación precisa de la SNR de salida experimentada por el usuario del audífono.
Configuración de la medición
La configuración de la medición, que se muestra en la Figura 1, se estableció en una sala con tratamiento acústico e incluía un maniquí KEMAR (en el centro de la configuración) y cuatro altavoces colocados a una distancia de 1 m. Se presentaron secciones de la Señal Internacional de Ensayo del Habla (ISTS) (Holube et al., 2010) se presentaron desde dos altavoces a 0° y 315° a un nivel de unos 76 dBA, mientras que un ruido de fondo consistente en una grabación realizada en una cafetería concurrida mezclada con ruido rosa se presentó desde dos altavoces a 135° y 225° a un nivel total de unos 72 dBA. De este modo, se obtuvo una SNR «de partida» de +4 dB para el entorno de prueba.
Para determinar la SNR de salida, se colocaron los audífonos en los oídos de KEMAR y se realizaron una serie de grabaciones con y sin inversión de fase de las distintas señales de entrada. La aplicación de la técnica de inversión de fase a las grabaciones permitió estimar cada una de las señales procesadas a la salida de los audífonos, tanto para las fuentes individuales de habla y ruido como para el habla y el ruido combinados, como se ilustra en la figura 1.
El escenario de la conversación se estableció alternando entre S0 y S315, con la señal presentada desde una dirección determinada durante 10 segundos antes de cambiar, como se indica en la figura 2. Cada grabación incluía dos secciones con S0 y dos secciones con S315, para un total de 40 segundos. Antes de la grabación, las señales sonoras estuvieron encendidas durante 50 segundos para permitir que todos los audífonos se asentaran.
El resultado del análisis es la SNR de salida de los distintos audífonos, promediada a lo largo del tiempo de evaluación. Debido a la disposición de la prueba, en la que el habla se presentaba desde la parte frontal y desde el lado izquierdo del KEMAR, presentamos las SNR de salida del audífono izquierdo, que es el más relevante para la comprensión del habla debido al efecto del mejor oído. En el análisis, calculamos la SNR global de la conversación, (S0+S315)/ (N135+N225).
Audífonos
Los audífonos de la competencia participantes están etiquetados como Marca A-C. En el momento de la medición, cada audífono representaba el audífono RIC premium más actual ofrecido por cada fabricante respectivo. Para las mediciones, Signia IX y todos los audífonos de la competencia se programaron para una pérdida de audición simétrica y plana de 50 dB, utilizando la configuración predeterminada prescrita por la lógica de adaptación recomendada (patentada) de cada fabricante. Todos los audífonos se probaron con la configuración predeterminada de su respectivo programa Universal. Para garantizar una aplicación válida de la técnica de inversión de fase, en todos los audífonos se desactivaron las funciones que manipulan la fase de la señal (cancelación de realimentación y compresión de frecuencia). Los audífonos se adaptaron a los oídos de los KEMAR mediante almohadillas de acoplamiento cerrado.
Para investigar el efecto de la reducción de ruido DNN aplicada en la plataforma impulsada por coprocesador AI ofrecida por la marca A, también se realizó una medición adicional con los audífonos de la marca A en un programa manual en el que la reducción de ruido DNN estaba desactivada. Las dos configuraciones de prueba se denominarán Marca A1 y Marca A2, respectivamente.
Como referencia, también se realizaron grabaciones en los oídos KEMAR abiertos (sin audífonos). Esto permitió calcular la SNR del oído abierto y utilizarla como referencia, representando la SNR de entrada.
La figura 3 muestra que los cuatro audífonos ofrecieron un beneficio de SNR, como ilustran los valores de mejora positivos. Signia IX ofreció claramente el mayor beneficio.
La mejora de la SNR de la conversación proporcionada por Signia IX, en comparación con la condición sin ayuda, fue de 8,1 dB, mientras que el mejor audífono de la competencia (Marca A1) ofreció una mejora de la SNR de 4,9 dB. Es decir, en este escenario de conversación, Signia IX ofreció una mejora en la SNR de salida de unos asombrosos 3,2 dB, en comparación con el mejor competidor.
Los tres audífonos de la competencia fueron bastante similares entre sí en su rendimiento del programa Universal, con mejoras dentro de 1 dB de diferencia (4,1 dB a 4,9 dB). En el caso del audífono de la marca A, la medición con la reducción de ruido DNN activada (A1) mostró una mejora (4,9 dB), que fue 1,2. dB superior a la mejora (3,7 dB) observada en la medición con la función desactivada (A2). Este efecto coincide con los datos publicados por el fabricante.
En este estudio, investigamos el rendimiento de SNR de salida de Signia IX y tres audífonos de la competencia en un escenario de conversación de grupo simulado con dos interlocutores en el hemisferio frontal y con ruido continuo procedente del hemisferio posterior. Los resultados mostraron que Signia IX superó a los tres competidores, ofreciendo un beneficio general de SNR de conversación de 8,1 dB en comparación con la escucha sin ayuda y de 3,2 dB en comparación con el mejor competidor.
Un aumento de 3 dB en la SNR corresponde a una duplicación de la relación entre la intensidad del habla y la intensidad del ruido. Por lo tanto, la ventaja observada de 3,2 dB en la salida del audífono significa que Signia IX ofrece más del doble del beneficio de mejora del habla en el escenario de conversación grupal ruidosa que el competidor de mejor rendimiento.
Al comparar los datos de este estudio SNR con los datos del estudio similar anterior (Jensen et al., 2023b), observamos el mismo rendimiento de Signia IX en los dos estudios. Obviamente, esto era de esperar, ya que el procesamiento dividido y el RTCE siguen siendo los mismos. En cuanto a los competidores, si bien observamos que sus nuevos productos presentan mejoras modestas en su rendimiento SNR de hasta 1,5 dB, en comparación con sus modelos anteriores, el rendimiento de Signia IX en la conversación dinámica de grupo sigue siendo superior.
Llegamos a la conclusión de que la diferencia significativa observada entre Signia IX y los demás audífonos de gama alta de la competencia se debe principalmente a la tecnología de procesamiento dividido y RTCE de IX. En primer lugar, el procesamiento dividido «siempre activo» de IX reduce el ruido por separado para mejorar el habla. En segundo lugar, RTCE proporciona un análisis avanzado de la disposición de la conversación de los interlocutores, localizando y adaptándose continuamente a los interlocutores y a las fuentes de ruido en tiempo real.
En la configuración de prueba, los audífonos Signia IX siempre reconocen si el habla procede de la parte frontal o lateral del usuario, lo que permite a la arquitectura multiflujo de RTCE adaptar el procesamiento de cada flujo en consecuencia. Esto crea un espacio auditivo dinámico en el que los hablantes activos se realzan, mientras que los sonidos ambientales extraños se procesan de forma independiente. RTCE se adapta perfectamente a los cambios en la conversación, como la toma de turnos, que se simuló en nuestro estudio alternando el habla desde la parte frontal y lateral del maniquí KEMAR.
Por último, este estudio destaca la capacidad del RTCE para permitir a los usuarios entablar una conversación sin tener que mirar siempre al interlocutor activo. Dado que la cabeza estacionaria de KEMAR mira hacia delante mientras que el habla alterna entre el frente y el lateral, el procesamiento del audífono debe adaptarse a la ubicación del habla en tiempo real. En última instancia, esto facilitará un comportamiento conversacional más natural en el mundo real, en el que el usuario podrá seguir fácilmente el flujo de la conversación. La capacidad de mejorar el habla de forma independiente y adaptarse rápidamente a las transiciones entre hablantes, que permite la arquitectura multi-stream de RTCE, es probablemente un factor clave en los beneficios de SNR proporcionados por Signia IX en comparación con los audífonos de la competencia. Los audífonos tradicionales (y todos los competidores de este estudio) utilizan un procesamiento de flujo único en el que el habla y el ruido se tratan de la misma manera. Aunque estos sistemas pueden aplicar algún tipo de procesamiento adaptativo cuando los interlocutores se turnan, suelen responder con demasiada lentitud para seguir el ritmo de cambios rápidos como los implementados en esta prueba. En las conversaciones reales, en las que los interlocutores se turnan cada 10 segundos es bastante realista, esta lenta adaptación puede limitar la eficacia de estos sistemas.
Cuando se escucha el habla en entornos ruidosos, existe una estrecha relación entre la SNR de la situación de escucha, la claridad de los interlocutores y la capacidad del oyente para comprender el habla. Mejorar la SNR de salida de un audífono suele mejorar la comprensión verbal en situaciones difíciles con ruido de fondo. Sin embargo, esta relación no es directa y depende en gran medida de las condiciones de escucha y de la SNR. En este estudio, nos centramos en medir la SNR de salida en condiciones bien definidas pero realistas para garantizar una comparación significativa y ecológicamente válida de los audífonos. Seleccionamos una SNR de prueba de alrededor de +4 dB -muy cercana a la SNR media de +4,6 dB para el habla en balbuceo informada por Smeds et al. (2015)- para replicar los tipos de situaciones de la vida real en las que los usuarios de audífonos comienzan a tener problemas con la comprensión del habla. En consecuencia, se eligió esta SNR porque es la que mejor refleja las condiciones del mundo real en las que el impacto del audífono es más importante para el usuario. Esto respalda nuestro objetivo de probar los audífonos únicamente en las condiciones que realmente importan a los usuarios en la vida cotidiana.
En este artículo, hemos presentado los resultados de un estudio técnico sobre el rendimiento de SNR proporcionado por Signia Integrated Xperience y tres audífonos de la competencia. Se realizó una evaluación técnica en una escena acústica que simulaba una conversación en grupo con ruido de fondo y dos interlocutores situados delante y al lado del usuario del audífono. La evaluación se basó en la técnica de inversión de fase de Hagerman, ampliamente utilizada, que permite estimar la SNR de salida proporcionada por los audífonos en la configuración dada.
Nuestro análisis demuestra una clara ventaja de rendimiento SNR para Signia Integrated Xperience con RealTime Conversation Enhancement. Signia IX proporcionó un beneficio de SNR de 8,1 dB en relación con la condición sin ayuda, y una mejora de SNR de 3,2 dB en relación con los audífonos competidores de mejor rendimiento.
Esto significa que Signia IX ofrece más del doble de beneficios de mejora del habla en una conversación de grupo ruidosa que los competidores más cercanos, incluidas las plataformas basadas en coprocesadores de IA.
Dado que las mejoras en la SNR de salida pueden estar relacionadas con mejoras en la comprensión del habla si el usuario se encuentra en una situación de conversación de grupo ruidosa en la que tiene dificultades para participar, los resultados de este estudio sugieren que Signia IX podría ofrecer potencialmente un gran beneficio en tales situaciones, facilitando al usuario la participación y la contribución a la conversación.
Folkeard P., Jensen N.S., Parsi H.K., Bilert S. & Scollie S. 2024. Hearing at the Mall: Multibeam Processing Technology Improves Hearing Group Conversations in a Real-World Food Court Environment. Am J Audiol, 33, 782-792.
Hagerman B. & Olofsson Å. 2004. A method to measure the effect of noise reduction algorithms using simultaneous speech and noise. Acta Acustica United with Acustica, 90(2), 356-361.
Holube I., Fredelake S., Vlaming M. & Kollmeier B. 2010. Development and analysis of an international speech test signal (ISTS). International Journal of Audiology, 49(12), 891-903.
Jensen N.S., Høydal E.H., Branda E. & Weber J. 2021. Improving speech understanding with Signia AX and Augmented Focus. Signia White Paper. Retrieved from www.signia-library.com.
Jensen N.S., Samra B., Kamkar Parsi H., Bilert S. & Taylor B. 2023a. Power the conversation with Signia Integrated Xperience and RealTime Conversation Enhancement. Signia White Paper. Retrieved from www.signia-library.com.
Jensen N.S., Samra B., Taghvaei N. & Taylor B. 2024. Improving the Real-World Conversation Experience With a Multi-Stream Architecture. Hearing Review, 31(9), 16-20.
Jensen N.S., Wilson C., Kamkar Parsi H. & Taylor B. 2023b. Improving the signal-to-noise ratio in group conversations with Signia Integrated Xperience and RealTime Conversation Enhancement. Signia White Paper. Retrieved from www.signia-library.com.
Korhonen P. & Slugocki C. 2024. Augmenting Split Processing with a Multi-Stream Architecture Algorithm. Hearing Review, 31(5), 20-23.
Manchaiah V., Picou E.M., Bailey A. & Rodrigo H. 2021. Consumer Ratings of the Most Desirable Hearing Aid Attributes. Journal of the American Academy of Audiology, 32(8), 537-546.
Nicoras R., Gotowiec S., Hadley L.V., Smeds K. & Naylor G. 2023. Conversation success in one-to-one and group conversation: a group concept mapping study of adults with normal and impaired hearing. International Journal of Audiology, 62(9), 868-876.
Picou E.M. 2022. Hearing aid benefit and satisfaction results from the MarkeTrak 2022 survey: Importance of features and hearing care professionals. Seminars in Hearing, 43(4), 301-316.
Slugocki C., Kuk F. & Korhonen P. 2024. Using Alpha-Band Power to Evaluate Hearing Aid Directionality Based on Multistream Architecture. Am J Audiol, Early Online, 1-12.