Una red neuronal puede reconocer y filtrar ciertos sonidos, cambiando la forma en que elegimos experimentar el mundo que nos rodea
Los futuros auriculares con supresión de ruido podrían permitir a los usuarios volver a escuchar ciertos sonidos que les gustaría oír, como el llanto de los bebés, el piar de los pájaros o el timbre de las alarmas.
La tecnología que lo hace posible, denominada audición semántica, podría allanar el camino a audífonos y auriculares más inteligentes, que permitan al usuario filtrar algunos sonidos y potenciar otros.
El sistema, que aún está en fase de prototipo, funciona conectando unos auriculares estándar con cancelación de ruido a una aplicación de smartphone. Los micrófonos integrados en estos auriculares, que se utilizan para anular el ruido, se reutilizan para detectar también los sonidos del mundo que rodea al usuario. A continuación, estos sonidos se reproducen en una red neuronal que se ejecuta en el teléfono inteligente, y se potencian o suprimen en tiempo real en función de las preferencias del usuario. El sistema ha sido desarrollado por investigadores de la Universidad de Washington (EE UU), que lo presentaron la semana pasada en el Simposio ACM sobre Software y Tecnología de Interfaz de Usuario (UIST, por sus siglas en inglés).
El equipo entrenó la red con miles de muestras de audio de conjuntos de datos en línea y sonidos recogidos en diversos entornos ruidosos. Luego le enseñaron a reconocer 20 sonidos cotidianos, como una tormenta, la descarga de un inodoro o la rotura de un cristal.
Se probó con nueve participantes que deambulaban por oficinas, parques y calles. Los investigadores comprobaron que el sistema amortiguaba y realzaba bien los sonidos, incluso en situaciones para las que no había sido entrenado. Sin embargo, le costaba un poco separar el habla humana de la música de fondo, sobre todo del rap.
Imitar la habilidad humana
Los investigadores llevan mucho tiempo intentando resolver “el problema del cóctel”, es decir, conseguir que un ordenador se concentre en una sola voz en una sala llena de gente, como pueden hacer los humanos. Este nuevo método representa un importante paso adelante y demuestra el potencial de la tecnología, afirma Marc Delcroix, investigador científico senior de NTT Communication Science Laboratories, Kioto (Japón), que estudia la mejora y el reconocimiento del habla y no participó en el proyecto.
“Este tipo de logro es muy útil para este campo”, afirma. “Han existido ideas similares, sobre todo en el campo de la separación del habla, pero ellos son los primeros en proponer un sistema completo de extracción de sonido objetivo binaural en tiempo real”.
“Hoy en día, los auriculares con cancelación de ruido tienen la capacidad de seguir reproduciendo música, aunque esté activado”, explica Shyam Gollakota, profesor adjunto de la Universidad de Washington que ha trabajado en el proyecto. “En lugar de reproducir música, reproducimos los sonidos reales de interés del entorno, que extrajimos de nuestros algoritmos de aprendizaje automático”.
Gollakota está entusiasmado con el potencial de esta tecnología para ayudar a las personas con pérdida de audición, ya que los audífonos pueden tener una utilidad limitada en entornos ruidosos. “Es una oportunidad única para crear el futuro de los audífonos inteligentes mediante la mejora de la audición”, afirma.
La capacidad de ser más selectivos sobre lo que podemos oír y lo que no también podría beneficiar a las personas que necesitan una escucha específica para su trabajo, como los profesionales de la sanidad, el ejército y la ingeniería, o los trabajadores de fábricas o de la construcción que quieren proteger su audición sin dejar de poder comunicarse.
Filtrar el mundo
Este tipo de sistema podría darnos por primera vez cierto grado de control sobre los sonidos que nos rodean, para bien o para mal, afirma Mack Hagood, profesor asociado de Medios y Comunicación de la Universidad de Miami (Ohio, EE UU) y autor de Hush: Media and Sonic Self-Control, que no ha trabajado en el proyecto.
“Este es el sueño: hace tiempo que la gente fantasea con esto”, dice. “Estamos marcando una casilla para saber si queremos oír esos sonidos o no, y podría haber ocasiones en las que este estrechamiento de la experiencia sea beneficiosa, algo que deberíamos hacer y que podría ayudar a promover una mejor comunicación”.
Pero siempre que optamos por el control y la elección, estamos dejando de lado la serendipia y los accidentes felices, afirma. “Decidimos de antemano lo que queremos oír y lo que no”, añade. “Y eso no nos da la oportunidad de saber si realmente nos habría gustado escuchar algo”.
technologyreview.es