• Innovación
  • Las máquinas aprueban el examen de catalán

Las máquinas aprueban el examen de catalán

Happy Scribe, con sede en el barrio de Gracia, ha desarrollado un algoritmo de audio "más preciso que el de Google"

Interior de las oficinas de Happy Scribe | Cedida
Interior de las oficinas de Happy Scribe | Cedida
Barcelona
14 de Marzo de 2023

Dos jóvenes y un piso de estudiantes en Irlanda, este es el punto de partida de la aventura de Happy Scribe. En un primer término, el francés André Bastié y el catalán Marc Assens crearon la primera herramienta de transcripción automática en un intento de acelerar el trabajo pendiente de una tarea del máster.

 

Con el paso de las semanas, los experimentos funcionaron con otras necesidades similares de compañeros universitarios. A principios del año 2017, Happy Scribe daba un paso adelante como proyecto empresarial. Los servicios de transcripción cuentan con una extensa base de datos superior a los 80 idiomas.

La sede de la startup está situada en Barcelona, concretamente en el barrio de Gràcia y con una plantilla de 20 personas. La actividad de Happy Scribe gira alrededor de dos modalidades de transcripción: pago y gratuita. Los principales clientes y usuarios del servicio son los creadores de contenidos, periodistas y profesionales del mundo legal.

 
team 1 highres cbd6fca2378df3399bd61af9bbcaa1b50c26a102cc1134360166292c726629c4
Imagen de la plantilla de la firma emergente | Happy Scribe

Comparación con Google

La última gran novedad de Happy Scribe es la aparición de un algoritmo de audio a texto en catalán "más preciso que el de Google", explica Oleguer Canal. El ingeniero de inteligencia artificial de la empresa vincula la fiabilidad del software a la extensa red de datos.

"Combinamos el acceso a recursos de voz propios y otras iniciativas públicas de gran magnitud como el proyecto AINA", añade Canal. Uno de los ejes principales de la plataforma Happy Scribe es el concepto machine learning. Es decir, evolución de producto a partir del uso de los clientes.

La versión automática de transcripción tiene un coste de 0,2 euros por minuto con una fiabilidad del 85%, mientras que este porcentaje sube hasta el 99% si se opta por el filtro humano. La BBC, Forbes, Spotify o las Naciones Unidas son algunas de las organizaciones usuarias de los servicios de Happy Scribe.

Hablar "de una forma natural" con la máquina

A pesar de que el punto fuerte de la empresa emergente es la transcripción automática, Canal recuerda como la forma de comunicación "más importante es hablar" y, por esta razón, Happy Scribe anda en esta dirección. "Tenemos que centrar los esfuerzos en algoritmos que entiendan las conversaciones de una forma precisa como un humano", describe el responsable de inteligencia artificial.

Más allá de esta fase inicial y el ejemplo del algoritmo catalán, Oleguer Canal presume que "no tardaremos demasiado tiempo a hablar de una forma natural con las máquinas". En paralelo a la acción empresarial, la administración también está creando un entorno favorable por este ecosistema.

iStock 1311449365
Imagen de un altavoz inteligente | iStock

A principios de año, la Generalitat anunció una inversión de 12 millones de euros en el Barcelona Supercomputing Center, a ejecutar hasta el 2026, con la voluntad de consolidar el carácter estratégico del proyecto AINA. La iniciativa pública ya ha recopilado más de un millón de cortes de voz y 2.400 horas grabadas en todas las variedades dialectales del catalán.