VIA Tech

SignarIA, o cómo las personas sordas también pueden hacer radio

Investigadores de la UPF y la empresa Sorensen AI desarrollan una herramienta para dotar a las personas sordas signantes de una voz sintética personalizada

Valores de empresa

Marc Vilajosana

Periodista

Barcelona

17 de Marzo de 2026 - 06:19

Act. 17 de Marzo de 2026 - 20:05

La pérdida de puestos de trabajo, la generalización de la desinformación, la vigilancia masiva de la sociedad, la pornografía infantil y la represión a inmigrantes han tenido, en el último año natural, un denominador común: la inteligencia artificial generativa. No es de extrañar, pues, que cualquier solución que se promocione usando estas tecnologías genere a su alrededor un halo de suspicacia en ciertos sectores de la sociedad. “Los últimos años, hablar de inteligencia artificial se ha convertido en un sinónimo de hablar de poder, control y geopolítica. Antes hablábamos de solucionar los problemas de la gente, de cómo podía servir a las personas, y no de cómo se servía de ellas”, ha resumido el ingeniero informático y CEO de Sorensen AI, Josep M. Ganyet.

Ante la disyuntiva presentada por Ganyet, en la Universitat Pompeu Fabra (UPF) han presentado este martes una nueva herramienta que apuesta con firmeza por el primer grupo, el de las tecnologías que buscan servir a las personas. Se trata de SignarIA, un software que quiere dotar a las personas sordas de un mecanismo para poder participar activamente en la radio y otros entornos audiovisuales. El proyecto, codesarrollado por los grupos de investigación POLCOM-GRP y LSC Lab con Sorensen AI, ha desarrollado un prototipo de voz sintética personalizable que los usuarios podrán usar en entornos audiovisuales sin renunciar al uso de la lengua catalana de signos (LSC).

SignarIA surge como una solución para derribar las barreras que afrontan los estudiantes sordos de Periodismo en las asignaturas de radio

La prueba más clara de la intencionalidad de servicio de la herramienta se encuentra en sus orígenes. “Todo esto nace del reto con el que nos encontramos, hace un año, en los estudios de Periodismo de la universidad”, ha recordado el profesor del Departamento de Comunicación de la UPF y uno de los dos investigadores principales de SignarIA, Marcel Mauri. Berta, una estudiante del grado, es una persona sorda signante, y cuando tuvo que empezar la asignatura de radio, no sabían cómo encararlo. “Le pareció que no podría hacerla, y dijimos: ‘Tenemos que encontrar una solución’. No puede ser que una alumna no pueda hacer una de las asignaturas importantes”, ha relatado Mauri. “Recuerdo la primera chispa, una llamada con Ganyet en la que le presenté la idea, un poco loca, de hacer una voz sintética para Berta, que ha hecho todo el grado de manera magnífica con un intérprete”, ha relatado por su parte Roger Cassany, el otro investigador principal de SignarIA y también profesor del departamento.

Identificada la necesidad, ambos profesores sumaron al equipo expertos en tecnología (Sorensen AI) y en interpretación y lengua de signos catalana (el grupo de investigación LSC Lab de la misma universidad) y se presentaron a un proyecto europeo para conseguir una fuente de financiación. Con la respuesta positiva, el proyecto se inició el mes de noviembre de 2025 y se ha extendido hasta este mismo mes de marzo, que ha finalizado con la presentación pública del prototipo este martes.

Un desarrollo tecnológico con tres innovaciones clave

Con la financiación, el calendario y el objetivo claro, había que ver cómo encarar la investigación, que acabó centrándose en buscar soluciones para dos retos principales: pasar de la LSC al texto, y pasar del texto a la voz. En el primero de los dos ámbitos, el gran obstáculo con el que se encontró el equipo de SignarIA es que la base de datos lingüísticos en LSC disponible actualmente era insuficiente para la tarea de traducción automática que pretendían hacer. Y la respuesta llegó con una doble solución.

Por un lado, el equipo amplió el corpus existente con la generación sintética de signos, limitado principalmente a las conjugaciones verbales: aprovechando la morfología de la LSC, a partir de la interpretación humana de un verbo en infinitivo podían confeccionar el resto de conjugaciones de aquel verbo con un personaje virtual en un entorno de videojuego. “El método ha sido aceptado para su publicación en el LREC 2026 -conferencia internacional sobre recursos lingüísticos e interpretación-. Es la primera piedra fundamental del proyecto”, ha asegurado la ingeniera responsable del desarrollo tecnológico de SignarIA, Inés Broto. Pero con esta ampliación no era suficiente, así que el equipo también ha incorporado un módulo de lenguaje, basado en un gran modelo de lenguaje (LLM), que a partir de los elementos clave captados visualmente por la cámara “ayuda a construir frases concretas y coherentes”, según ha explicado Cassany.

La voz sintética de SignarIA combina el timbre de la persona sorda signante con la prosodia de un familiar próximo, que actúa de "donante de voz"

Con estas dos innovaciones, el sistema que han desarrollado es capaz de entender la interpretación en lengua de signos del usuario, captada a través de la cámara, y traducirla a lengua escrita. Pero para convertir este texto en voz no se han limitado a usar modelos comerciales o de código abierto ya disponibles con voces neutras, ya que, según ha comentado Cassany, “por la carga ética, era necesario respetar la voz del usuario”. Es aquí donde nace el concepto que los autores han denominado identidad sonora, una voz sintética que mezcla el timbre de la voz de la persona sorda con la prosodia (acento, ritmo, entonación…) de un “donante lingüístico” próximo, que suelen ser familiares. “La manera como hablamos viene muy definida por nuestro entorno, sobre todo cuando somos más jóvenes”, indica el también ingeniero responsable del desarrollo tecnológico de SignarIA, Xavi Vinaixa. “Todo esto son cosas inéditas, nos hemos tenido que romper la cabeza”, ha aseverado.

Todo esto toma la forma de una plataforma web que, a través de diferentes módulos, capta, procesa y transmite los mensajes. En la parte superior, la plataforma muestra una transcripción en tiempo real de la lengua hablada de los interlocutores de la persona sorda, para que esta no tenga que depender exclusivamente de los intérpretes, pero a la vez también para dar contexto al sistema informativo al sistema, que se puede ampliar en forma de texto. Por otro lado, en la parte inferior, una cámara capta la imagen del usuario, a la cual se superpone un “esqueleto” digital que interpreta los signos de la LSC; y al lado, las transcripciones en texto que hace, siempre con tres variantes: una concisa, una complementada con el contexto que tiene y una más creativa. La opción que escoja la persona sorda es la que se reproducirá con la voz sintética creada para la ocasión.

La evaluación de personas sordas y profesionales de radio

Pero más allá del desarrollo tecnológico de la herramienta, había que ver si aquello que se había planteado sobre el papel tenía una utilidad real. Es por eso que el equipo investigador ha llevado a cabo dos dinámicas de grupo: una primera con personas sordas signantes, y una segunda con profesionales del periodismo radiofónico y docentes de la universidad. La primera de estos encuentros les sirvió para ver que, más allá del uso original, el mundo de la radio, SignarIA también podía tener otras aplicaciones en ámbitos como la formación en línea o los juicios. Los participantes valoraron positivamente la solución, aunque expresaron algunas dudas sobre la intromisión personal que podía suponer el uso de la IA; y también ofrecieron puntos de mejora, como la necesidad de una bidireccionalidad (que los mensajes orales también se tradujeran a lengua de signos) o de una mejora en usabilidad (por ejemplo, que se desarrollara en forma de aplicación para móviles y no fuera necesario llevar encima un portátil).

La bidireccionalidad, una menor dependencia de los ordenadores y una mejora en la agilidad son algunos de los puntos a mejorar en versiones futuras del prototipo

Por su parte, los profesionales destacaron la herramienta como un “ejercicio de empatía y ruptura de barreras”, según ha explicado la coordinadora del proyecto, Cecilia Barba, y también aspectos positivos como la pérdida de dependencia de los intérpretes -aunque la herramienta se presenta como un complemento y no como un sustituto de estos- o la sencillez de la interfaz. Como aspectos a mejorar, la dependencia de un ordenador, la falta de entonación de las voces sintéticas y la poca agilidad de interacción fueron los principales apuntes.

El nuevo paradigma para los periodistas del futuro

Con todos estos puntos por mejorar, el equipo afronta ahora una nueva etapa del proyecto, en la que se quiere acabar de mejorar el estado actual y ampliarlo con cuestiones como la bidireccionalidad o la posibilidad de adaptarlo a otras lenguas de signos. Uno de los aspectos principales será la personalización de las voces: en el prototipo actual, solo se ha desarrollado una única voz sintética, la del estudiante de Periodismo que originó el proyecto, pero la intención es que los mismos usuarios puedan generar las suyas propias de manera sencilla con la ayuda de un donante lingüístico.

Ante las posibilidades que otorga el proyecto de SignarIA, el periodista sordo y fundador de la agencia Sord Press, Guillem Carles Gonel, ha admitido sentir “un poco de envidia” de los alumnos que estudiarán Periodismo a partir de ahora. “En 1971, en la UAB, cuando yo estudié Periodismo, no había nada, no tenía ni intérprete, estaba totalmente solo. Mi tutor, el escritor Manuel Vázquez Montalbán, me dijo: ‘Tú, que eres una persona sorda, ¿quieres trabajar como periodista? ¿Cómo te las arreglarás?’”, ha recordado en una mesa redonda posterior a la presentación de la herramienta. En su trayectoria, Carles Gonel ha participado varias veces en medios radiofónicos, pero en varias ocasiones se había sentido “como si estuvieran manipulando mi voz o usándome como marioneta”. “Ahora, con SignarIA, pienso que podemos participar con mucha más calidad; ya no nos haría falta ni un intérprete, podría hablar directamente. Esta herramienta es muy importante, para la radio o para cualquier medio digital”, ha reivindicado el periodista.

Se ha mostrado igualmente positiva la profesora asociada de comunicación y radio en la UPF, Imma Amadeo Gurí, quien en los 25 años que ha ejercido como docente en la universidad, el curso pasado fue la primera vez que afrontó el reto de formar a una alumna sorda en radio. “Con ella todo fue fácil, porque es una alumna para quien las barreras no existen”, ha reivindicado Amadeo. A pesar de que no pudo llevar a cabo el ejercicio final de locutar un informativo en directo, el equipo docente le pidió que les ayudara a confeccionar una guía para ayudar a hacer que las personas sordas puedan trabajar en la radio. De los diversos consejos, Amadeo destaca la importancia de que “las personas sordas son muchas y muy diversas, y cada una tiene unas diversidades muy personales” que hay que entender. La profesora también ha subrayado la importancia de hacerlas partícipes en el proceso de enseñanza y en su trato como fuentes: “Es necesario que cuando se las llame a los medios, no se las llame en calidad de personas sordas, sino como biólogos, científicos o la experiencia que tengan”.

Amadeo: “Es necesario que cuando se las llame a los medios, no se las llame en calidad de personas sordas, sino como biólogos, científicos o la experiencia que tengan”

En un ámbito más metodológico, Ganyet ha asociado los problemas de comunicación a “un tema puramente tecnológico”: “El sonido es un cambio de presión del aire, y si no tienes un medio capaz de producirlo, no hay transmisión de información”. Si hasta ahora la voz ha sido “la interfaz para conectar dos cerebros”, proyectos como SignarIA demuestran el surgimiento “de unas tecnologías que nos permiten ampliar esta capacidad comunicativa”. “Por primera vez, tenemos un prototipo, y a la velocidad que va todo, en muy poco tiempo un producto viable”, ha celebrado el CEO de Sorensen AI. Para el experto, la iniciativa es un ejemplo de una “aplicación ética de la tecnología”, ya que, volviendo al inicio, se trata de un proyecto que “vuelve a servir a las personas”. “Cuando creamos Sorensen con la gente de Minoria Absoluta, era con esta vocación: utilizar la IA de manera ética, aplicada a nuestra cultura y a nuestros dialectos. Entramos por eso, y este proyecto lo reúne absolutamente todo”, ha remachado.