Com aprèn idiomes Siri?

L'assistent virtual dels productes d'Apple requereix un complex procés per ser capaç d'entendre i parlar cada nova llengua

La història que hi ha al darrere de Siri, l'assistent personal que hi ha a tots els iPhones, iPads i Macs, és força curiosa. Tot i ser un producte d'Apple, el seu origen es remunta a l'any 2007, al Centre d'Intel·ligència SRI International, com a spin-off d'un programa d'investigació de la DARPA –la divisió d'investigació de les forces armades dels Estats Units–.

El 4 d'octubre de 2011, Apple el va presentar com a producte propi i part del llavors nou iPhone 4S, amb integració conversacional amb aplicacions com els recordatoris, l'estat del temps, la borsa, missatges, correu electrònic, calendari, contactes, notes, rellotge, mapes i una inacabable llista de serveis de tercers.

Amb el temps no van trigar a sortir-li competidors com ara Google Now i Microsoft Cortana. Tots ells força avançats, però amb una gran mancança respecte a Siri: els idiomes.

Actualment l'assistent d'Apple és capaç de parlar i comprendre molts més idiomes que la seva competència i això el fa semblar, sens dubte, molt més intel·ligent.

Alex Acero, responsable de l'equip de pronuncia de Siri, va explicar fa uns dies com era el procés de Siri per aprendre un nou idioma. I és força més complex del que pugui semblar.

Inicialment, Apple va llicenciar una plataforma de veu de Nuance per alimentar la base lingüística del seu assistent virtual, però des de l'any 2013 ja n'utilitza una de pròpia.

Aprendre un nou idioma
Per ensenyar un nou idioma a Siri, Apple selecciona un grup de persones de diferents zones geogràfiques on es parla la llengua en qüestió, de manera que aquest grup cobreixi el major nombre de pronunciacions i dialectes de la llengua. Un cop triats, se'ls demana que llegeixin uns paràgrafs de text seleccionats i una sèrie de paraules.

Un cop fet, aquests enregistraments es transcriuen i marquen de manera manual per humans, de manera que s'aconsegueix verificar exactament les variacions de cada paraula. A partir d'aquí, els resultats s'envien a un algorisme d'intel·ligència artificial que les processa, classifica i n'aprèn.



En base a aquest procés, la intel·ligència artificial comença a predir la manera correcta de pronunciar diverses paraules que no figuren en l'enregistrament inicial, i comença a generar paraules i frases complertes.

Però el punt més brillant del procés és que aquest algorisme d'anàlisi no deixa mai de treballar. Cada cop que fem servir Siri per donar-li una ordre o dictar-li una cadena de text, la intel·ligència artificial analitza la nostra pronuncia i la incorpora a la seva base de dades.

Abans d'enviar el nou paquet d'idioma a Siri, Apple l'introdueix en el sistema de dictat d'iOS i MacOS (sabeu que els dispositius d'Apple poden escriure text a partir de la veu, oi?), i amb les dades de veu que n'obté dels seus usuaris un nou grup d'humans en transcriu mostres de manera manual per afinar encara més la pronunciació.

Finalment, després de tot aquest procés, Apple publica una actualització de software que incorpora el nou idioma.

Més enllà de la curiositat de com de complex és el procés, conèixer-lo ens dóna esperança que el català pugui sumar-se aviat a la llista d'idiomes suportats per Siri. Actualment, els Mac i iPhone ja el suporten com a llengua de dictat.
Avui et destaquem
El més llegit