• Innovació
  • Les màquines aproven l'examen de català

Les màquines aproven l'examen de català

Happy Scribe, amb seu al barri de Gràcia, ha desenvolupat un algorisme d’àudio "més precís que el de Google"

Interior de les oficines d'Happy Scribe | Cedida
Interior de les oficines d'Happy Scribe | Cedida
Barcelona
14 de Març de 2023

Dos joves i un pis d’estudiants a Irlanda, aquest és el punt de partida de l’aventura d'Happy Scribe. En un primer terme, el francès André Bastié i el català Marc Assens van crear la primera eina de transcripció automàtica en un intent d’accelerar la feina pendent d’una tasca del màster. 

 

Amb el pas de les setmanes, els experiments van funcionar amb altres necessitats similars de companys universitaris. A principis de l’any 2017, Happy Scribe feia un pas endavant com a projecte empresarial. Els serveis de transcripció compten amb una extensa base de dades superior als 80 idiomes. 

La seu de la startup està situada a Barcelona, concretament al barri de Gràcia i amb una plantilla de 20 persones. L’activitat d'Happy Scribe gira al voltant de dues modalitats de transcripció: pagament i gratuïta. Els principals clients i usuaris del servei són els creadors de continguts, periodistes i professionals del món legal. 

 
team 1 highres cbd6fca2378df3399bd61af9bbcaa1b50c26a102cc1134360166292c726629c4
Imatge de la plantilla de la firma emergent | Happy Scribe 

Comparació amb Google 

La darrera gran novetat d'Happy Scribe és l’aparició d’un algoritme d’àudio a text en català “més precís que el de Google”, explica Oleguer Canal. L’enginyer d’intel·ligència artificial de l’empresa vincula la fiabilitat del programari a l’extensa xarxa de dades. 

“Combinem l’accés a recursos de veu propis i altres iniciatives públiques de gran magnitud com el projecte AINA”, afegeix Canal. Un dels eixos principals de la plataforma Happy Scribe és el concepte machine learning. És a dir, evolució de producte a partir de l’ús dels clients. 

La versió automàtica de transcripció té un cost de 0,2 euros per minut amb una fiabilitat del 85%, mentre que aquest percentatge puja fins al 99% si s’opta pel filtre humà. La BBC, Forbes, Spotify o les Nacions Unides són algunes de les organitzacions usuàries dels serveis d'Happy Scribe. 

Parlar “d’una forma natural” amb la màquina

Tot i que el punt fort de l’empresa emergent és la transcripció automàtica, Canal recorda com la forma de comunicació “més important és parlar” i, per aquesta raó, Happy Scribe camina en aquesta direcció. “Hem de centrar els esforços en algoritmes que entenguin les converses d’una forma precisa com un humà”, descriu el responsable d’intel·ligència artificial. 

Més enllà d’aquesta fase inicial i l’exemple de l’algoritme català, Oleguer Canal presumeix que “no trigarem massa temps a parlar d’una forma natural amb les màquines”. En paral·lel a l’acció empresarial, l’administració també està creant un entorn favorable per aquest ecosistema.

iStock 1311449365
Imatge d'un altaveu intel·ligent | iStock

A principis d’any, la Generalitat va anunciar una inversió de 12 milions d’euros al Barcelona Supercomputing Center, a executar fins al 2026, amb la voluntat de consolidar el caràcter estratègic del projecte AINA. La iniciativa pública ja ha recopilat més d’un milió de talls de veu i 2.400 hores gravades en totes les varietats dialectals del català.