Entrevista

Luc Julia, cocreador de Siri: "Apple aviat llançarà la Siri que somiàvem fa 30 anys"

L'actual director de ciència de Renault revela a VIA Empresa (gairebé) tots els secrets de l'assistent de veu més famós del món

VIA Tech

Luc Julia, director de ciència a Renault i cocreador de Siri | Cedida

David Lombrana

Cap de redacció

Barcelona

02 de Novembre de 2025 - 05:30

Quan és preguntada pel seu creador, Siri, el famós assistent de veu d’Apple, es fa l’orni. “Com diu a la capsa… Apple em va dissenyar a Califòrnia”, apunta reiteradament a VIA Empresa. Però no ens enganya. Luc Julia (Toulouse, 1966) és el cervell darrere de Siri, en haver impulsat, des de SRI International i ja fa 30 anys, les primeres patents que van donar lloc a un dels assistents més coneguts del món. Aquestes patents es van integrar a una empresa que compartia nom amb l’assistent -posteriorment adquirida per Apple-, i es van separar temporalment de Julia, qui va continuar vinculat a projectes emergents tecnològics, tots ells des de Califòrnia.

El 2010, Julia va fer una estada d’un any a HP com a director de tecnologia, fins que, a finals del 2011, l’equip de Siri ja integrat al gegant tecnològic, el va sol·licitar per dirigir el gran projecte que suposava aquest assistent per a la companyia, amb les patents que ell mateix havia desenvolupat la dècada anterior. Inquiet per naturalesa, posteriorment Julia va fer un curiós salt d’Apple a Samsung per dedicar-se al món de l’Internet de les Coses (IoT) i no pas a l’assistent que aleshores desenvolupava el gegant sud-coreà. “Era un assistent dolent. Molt dolent”, confessa qui és l’actual director de ciència del grup Renault, i el cap de cartell del passat AI Summit, celebrat a Barcelona. Amb la convicció que “la intel·ligència artificial no existeix”, Julia reserva una estona per repassar la seva trajectòria -i la de Siri, per cert, activa al seu mòbil- amb VIA Empresa i vaticinar el futur que li espera a una indústria automotriu cada vegada més tecnològica.

Vostè és l’autor del best-seller L'intelligence artificielle n'existe pas (La intel·ligència artificial no existeix). Li confesso que se’m va fer estrany veure’l com a cap de cartell en el passat AI Summit, celebrat aquest octubre a Barcelona.

(Riu). El títol d’aquest llibre serveix per explicar que la intel·ligència artificial que no existeix és la que jo anomeno intel·ligència artificial de Hollywood. La que veiem a pel·lícules com Terminator, la que fa por, la que ens matarà, però també la que surt a pel·lícules com Her, aquella intel·ligència artificial de la qual un humà s’acaba enamorant. Doncs bé, això no existeix, això és ciència-ficció. I la intel·ligència artificial real no és ciència-ficció, és ciència.

És clar que les conseqüències dels usos que li donem i que pot patir la humanitat tampoc són ciència-ficció.

Exacte. Tenim intel·ligències artificials especialitzades en cada àmbit concret que necessitem, i representen un conjunt d’eines molt bones que, per definició, són millors que nosaltres. Quan sento dir que “la intel·ligència artificial serà millor que els humans”, no puc evitar riure; les intel·ligències artificials ja són millors que nosaltres, des del principi. Són millors que nosaltres en les tasques per a les quals les hem construït i les podem fer servir bé o malament.

"Al final del dia, no és la IA qui decideix, sinó nosaltres. Som nosaltres som qui tenim el martell a la mà"

Això també és possible amb un martell. Puc fer-lo servir per colpejar-li el cap algú, no està fet per això, però ho puc fer. El mateix passa amb les intel·ligències artificials. Si les fem servir bé, poden ser fantàstiques, però en cas contrari, poden fer mal, molt de mal. Poden servir per desinformar, crear notícies falses, etcètera. La IA pot ser molt bona fent això, però, al final del dia, no és la IA qui decideix, sinó nosaltres. Som nosaltres som qui tenim el martell a la mà.

La seva extensa trajectòria en el sector tecnològic s’inicia als noranta, a SRI International, on va ser coautor de les principals patents que el 2011 van acabar donant llum a Siri, un dels assistents intel·ligents més reconeguts a tot el món. Què es pretenia crear en aquell moment, i com aquestes patents es van acabar introduint a Apple?

Ens trobàvem a mitjans dels noranta, als inicis d’internet i, per tant, abans de Google. Aleshores encara no hi havia una manera real de fer cerques a internet, hi havia alguns motors de cerca, però eren molt complicats, era tot un caos. Llavors la idea de Siri, al començament, era crear un assistent que ajudés l’usuari a navegar per internet, i que pogués parlar amb ell amb un llenguatge natural i fer-li preguntes molt específiques.

Aquesta era la idea de superassistent al principi de tot, i vam desenvolupar les patents pertanyents a finals dels noranta. Però aquestes patents es van acabar integrant deu anys més tard en una empresa anomenada Siri, que va agafar aquestes patents, va crear l’actual assistent que tots coneixem a l’iPhone, i finalment va ser comprada per Apple l’any 2010. Com que aquesta firma tenia les patents inicials, més totes les que havia desenvolupat ella mateixa posteriorment, Apple va decidir comprar tot aquest conjunt.

He seguit el camí de les primeres patents que van originar Siri, però no el seu. Va continuar el rumb de les seves patents o se les va acabar retrobant posteriorment a Cupertino?

Efectivament, l’any 2011 em vaig retrobar amb les meves patents. L’equip que treballava a l’empresa de Siri, concretament Adam Cheyer, un bon amic de fa més de 30 anys, em va demanar que anés a dirigir Siri a Apple, un cop l’empresa ja havia estat comprada. Per tant, així va ser, vaig anar a parar a Apple per dirigir l’equip de Siri amb les meves pròpies patents i tot allò que s’havia desenvolupat fins aleshores.

L'assistent de veu d'Apple, Siri, en un iPhone | Europa Press

Dues preguntes molt ràpides que no puc evitar fer-li. La primera, per què Siri es diu Siri?

Que per què Siri es diu Siri? (Riu). No tindrà resposta a aquesta pregunta perquè és un secret.

Un secret?

Sí. No puc dir més.

Doncs a veure si hi ha sort amb la segona. Vostè és considerat el pare de Siri. Recorda les seves primeres paraules?

En realitat soc més aviat l’avi de Siri, perquè fa molt de temps de tot això, però recordo perfectament la primera pregunta que li vam fer realment a Siri. Li vam demanar que trobés tots els hotels de San Francisco amb piscina. Era una consulta complexa, i la idea era veure si l’assistent podia respondre aquest tipus de peticions. Ara bé, això és el que vam fer als inicis, després, quan va arribar a Apple, es va simplificar molt més, de fet encara avui dia Siri és molt simple i no és conversacional de la manera que nosaltres ho havíem imaginat als anys noranta. Així i tot, crec que Apple aviat llançarà una versió més conversacional, i que s’assemblarà molt més al que nosaltres somiàvem fa 30 anys.

"La primera pregunta que li vam fer a Siri va ser que trobés tots els hotels de San Francisco amb piscina"

Com és possible que Siri s'activi en pronunciar les paraules màgiques “Hey Siri”? Ens escolta les 24 hores del dia?

Siri no ens està escoltant tot el temps ni tot el que diem. Molta gent acostuma a creure que ho grava tot, però no és veritat. El que sí que és cert és que està sempre està a l’espera de sentir les paraules clau “Hey Siri” (s’activa Siri en el telèfon de Julia). Veus! Només sent aquesta expressió clau, i de manera local. Quan la detecta, aleshores comença a gravar la consulta de l’usuari, i és únicament aquesta consulta la que s’envia al núvol.

I quin és el trajecte que fa la consulta o petició de l’usuari?

Si la consulta es resol correctament, la resposta torna al dispositiu i la petició queda oblidada, no es guarda. És cert que, de vegades, la consulta sí que es pot conservar al núvol si no ha assolit el llindar mínim de reconeixement. Això vol dir que, si Siri dubta a l’hora de reconèixer una consulta, a causa de la seva qualitat, la petició es guarda perquè posteriorment una persona la pugui escoltar, comprovar què ha reconegut el sistema i què ha dit realment l’usuari. Aquest és l’únic cas en què les gravacions es conserven, perquè les escoltin humans, però a més estan anonimitzades, es revisen només per millorar Siri i després s’eliminen.

D'altra banda, creu que nosaltres, els humans, estem dissenyats per interactuar les 24 hores del dia amb Siri o qualsevol dels assistents que existeixen en l’actualitat? Fins a quin punt hem d’estrènyer el nostre vincle amb la tecnologia?

La tecnologia evoluciona cap a uns assistents el més antropomòrfics possible, així, quan parlem amb ells, podem creure que ens entenen i que podem tenir una conversa. I aquesta manera de dissenyar-los té coses bones i dolentes. Pot ser bo perquè permet mantenir una conversa normal, i més ara, amb l’auge de la IA, però també pot ser negatiu, perquè de vegades confiem massa en les seves respostes. Hi ha una línia molt fina per fer entendre a la gent que els assistents només són robots, que no són intel·ligents, i que saben allò que nosaltres els hem ensenyat, res més. Ara bé, tot i que no siguin humans, necessitem que es comportin com a tal perquè la comunicació amb ells sigui més senzilla.

El concepte d’intel·ligència té avui el mateix significat que tenia quan vostè dirigia Siri des de Cupertino?

El concepte d’intel·ligència és un concepte molt complex. Honestament, no sé què és la intel·ligència. No en tinc ni idea. Hi ha molta gent que intenta definir-la, filòsofs que intenten donar diferents significats a la intel·ligència, i psicòlegs que li donen un altre tipus de definició. Ara bé, específicament en l’àmbit dels assistents, intel·ligència vol dir informació.

En el recent AI Summit, molt probablement es va creuar amb força catalans i catalanes que encara no poden conversar amb Siri amb la seva llengua materna. Alhora, la cita es va celebrar en el que és considerat un dels principals hubs d’Europa. Què creu que veurem abans, Siri parlant català, o un assistent de veu català que, en aquest territori, s’imposi al desenvolupat a Cupertino?

Doncs no sabria què dir-li. L’actual Siri funciona en unes 30 llengües, i al món n’hi ha milers, per tant, Apple ha hagut de fer una tria. El català és una llengua que a mi personalment m’agrada molt perquè hi tinc una relació molt propera, ja que vaig néixer a Tolosa, i Catalunya és molt a prop d’Occitània. A més, avui dia, ja hi ha alguns sistemes de reconeixement de veu que entenen el català, però pel que fa als “grans”, no sé ni quan ni com tenen previst integrar-lo en els seus fulls de ruta.

ChatGPT s’ha integrat a la IA d’Apple, Apple Intelligence, per donar respostes que potser Siri no és capaç. Què sent quan veu que Siri, més d’una dècada més tard, s’ha quedat enrere en comparació a models que han sorgit recentment?

Apple no innova ràpidament. Per tant, arran de l’onada d’intel·ligència artificial generativa que ha arribat en els darrers dos o tres anys, la companyia es va veure obligada a integrar OpenAI. Per a Apple ha estat un bon acord, perquè ha estat gratuït i perquè a més els ha permès aprendre què demanen els usuaris a Siri amb ChatGPT integrat, i quines preguntes sap respondre aquesta darrera que la primera no.

Estic segur que en la pròxima versió, que no trigarà a arribar, Apple aprofitarà tot aquest aprenentatge. Siri utilitzarà cada vegada més la intel·ligència artificial generativa en el futur, i acabarà desprenent-se d’OpenAI. Apple ha fet servir OpenAI per aprendre, cosa que necessitaven fer durant un o dos anys.

La seva etapa a Cupertino va concloure per iniciar una de nova a Samsung, competència directa d’Apple, com a director de tecnologia. Vostè, que ha tocat de molt a prop la tecnologia de dos líders del mercat de la telefonia mòbil, quines grans diferències destaca entre tots dos?

Val a dir que, quan vaig deixar Apple per anar a Samsung, vaig decidir expressament no incorporar-me a la divisió de mòbils ni a la d’assistents de veu. Samsung tenia un assistent que no era gaire bo, i jo no volia dedicar-me a ell. Per tant, vaig voler dedicar-me al segon àmbit que més m’agrada, el de l’Internet de les Coses (IoT), i va ser exactament el que vaig fer, connectar objectes. Així, no vaig treballar directament amb el reconeixement de veu, tot i que, evidentment, vaig observar i seguir el que estaven fent.

I bé?

Crec que l’error que cometia Samsung amb el reconeixement de veu en aquell moment era intentar fer-ho tot per si mateixos, sense tenir les capacitats necessàries. D’aquesta manera, el resultat era dolent, molt dolent. Més endavant van comprar una empresa per intentar millorar el seu assistent, però tampoc els va funcionar gaire bé. Com a mínim ho van intentar.

"Apple ha fet servir OpenAI per aprendre, cosa que necessitaven fer durant un o dos anys"

Si haig de comparar totes dues companyies des d’una perspectiva global, en el fons són molt similars. Tant Apple com Samsung tenen una cultura molt reservada i els agrada desenvolupar-ho tot internament, tot i que de tant en tant compren alguna empresa que els pugui ajudar a avançar més de pressa. Però no són grans compradores com sí que ho són moltes altres empreses de Silicon Valley, que contínuament adquireixen startups. A més, la manera com es gestionen les dues companyies també és molt semblant, ja que és molt jeràrquica. Per tant, tot i que la cultura coreana i l’americana siguin molt diferents, al final, les empreses s’assemblen molt.

Ara n’està a una d’europea, concretament, francesa; és el director de ciència a Renault. És el cotxe el pròxim espai natural per als assistents de veu?

Durant molt de temps hem intentat posar assistents de veu al cotxe, i durant molt de temps no ha funcionat. És una tasca molt complicada, perquè hi ha soroll, i encara més si baixes la finestra o si portes els nens al darrere. Quan vaig arribar a Renault vaig intentar canviar la manera com fem servir els assistents i com ens relacionem amb aquests, i el que ara estem veient que millor funciona és afegir un personatge a la pantalla. Així, podem veure a qui li parlem i la nostra sensació a l’hora d’interactuar amb els assistents és millor, perquè podem tenir la sensació que ens estan escoltant. El reconeixement de veu és complicat, però funciona molt millor quan comptem amb una interacció visual.

Luc Julià, durant el passat AI Summit celebrat a Barcelona | Cedida

Luc Julia, durant el passat AI Summit celebrat a Barcelona | Cedida

Hi ha algun cotxe de Renault equipat amb un assistent com el que defineix?

Sí, el Renault 5, el cotxe que la companyia va llançar el desembre del 2024, compta amb el suport de Reno, l’assistent que apareix en format de petit personatge a la pantalla. I està funcionant força bé. Es tracta d’una IA generativa que sap molt sobre el cotxe, i li pots demanar que baixi la finestra o fer-li preguntes complexes, és un veritable model de llenguatge extens (LLM).

Un dels escenaris futuristes amb què més fantasieja la indústria de l’automoció és aquell en què els vehicles seran autònoms. Creu que, en algun moment, podrem delegar la conducció a Reno o fins i tot a Siri?

No. Mai ho podrem fer. Existeixen cinc nivells diferents quan ens referim a la conducció autònoma, i actualment voltem entre el segon i el tercer. Això vol dir que, actualment, els cotxes nous ja frenen millor que nosaltres, veuen millor que nosaltres i saben millor que nosaltres què hi ha al nostre voltant. El cotxe ja és millor que nosaltres en molts sentits. Però hi ha moltes altres tasques i escenaris per als quals no està preparat, i que els humans sí.

Assolirem el quart nivell, que és el cas dels taxis robot o robotaxis que ja hem vist a San Francisco, o a certs indrets de la Xina, però que es troben en un espai molt limitat i que circulen per zones molt conegudes i, per tant, no acostuma a haver-hi sorpreses. Però quan hi hagi una sorpresa, ha d’haver-hi sempre algú que prengui el control del cotxe, i precisament això impedeix que mai assolim el nivell cinc, ja que a la carretera sempre hi haurà un element desconegut i que no podem anticipar. I quan els humans veiem quelcom que no hem vist abans, ens adaptem, en canvi, la IA no té aquesta capacitat, i davant un escenari desconegut s’aturarà, que de fet és el que ja passa amb els vehicles que compten amb el quart nivell d’autonomia.

Després de la seva reflexió, no sé si aquest quart nivell que menciona serà realment una bona notícia per a les nostres carreteres.

Sí, és clar que serà bo. S’evitaran molts accidents. Hi continuarà havent, però potser es redueixen en un 80 o un 90% el milió de morts que hi ha a la carretera cada any, cosa que seria increïble. Aquest quart nivell serà sens dubte una nova notícia. El cinquè, en canvi, opino que és simplement impossible.