Les demos les carrega el dimoni

16 de Maig de 2024

Setmana intensa pel que fa a la IA generativa. Dilluns OpenAI presentava el seu nou ChatGPT 4o i l’endemà Google presentava a la seva conferència anual per a desenvolupadors Google I/O més novetats de les que podem processar.

Sempre m’ha fet gràcia aquesta manera que té Google d’anomenar els seus productes. El nom de Google I/O fa de mal escriure; el Gemini, el seu model insígnia d’IA es deia Bard; l’Android, que és un sistema operatiu, té nom de robot; una de les novetats que vam veure dimarts al Google I/O és un bloc de notes basat en IA que porta el críptic nom de LearnLM. I podríem continuar. Vull pensar que en realitat tot aquest despropòsit mnemotècnic és un homenatge al nom de l’empresa que havia de ser googol (el nom de la xifra d’un u seguit de cent zeros), però que van acabar registrant com a Google per un error fonètic.

OpenAI va presentar novetats rellevants dilluns per contraprogramar els anuncis que es preveien de Google. Malgrat moltes de les novetats al seu ChatGPT 4o —més context, cerca a la web, més accessible de franc, més interaccions pels membres premium— el que va captar l’atenció i la imaginació de tothom van ser els vídeos de gent conversant amb la versió mòbil de ChatGPT 4o de manera natural. Les respostes, en veu, són molt fluïdes, amb entonació natural, permeten les interrupcions i mostren un cert sentit de l’humor. També s’hi veu com de manera natural canvien de veu a vídeo i ChatGPT 4o respon on som, què fem i assisteix en preguntes de feina. La reacció unànime a les xarxes va ser de “Hem arribat a Her”, en referència a l’assistent de la pel·lícula Her de Spike Jonze. De moment encara no està accessible per a tothom i els usuaris premium hi anirem tenint accés de manera controlada.

I dimarts va ser el torn de Google. Fins ahir, les presentacions d’OpenAI havien agafat Google amb el pas canviat. Ja des del principi a can Google van ser molt cauts a l’hora d’alliberar serveis basats en IA generativa; internament es referien a ChatGPT com a “el prototip”. Recordem que la tecnologia GPT es va desenvolupar a Google i la tenia al calaix. Voldria pensar que era per ètica social, pels dubtes al voltant del seu impacte en la societat, però crec que ho van fer per raons empresarials resumides en el dilema de l’innovador: si trec un assistent basat en IA que tingui totes les respostes canibalitzo el model de negoci del meu cercador de Google.

"Sembla que el goril·la ha sortit a la pista borratxo d’IA i ha escombrat tothom"

Satya Nadella, el CEO de Microsoft, en incorporar ChatGPT al seu cercador Bing va dir que ells eren molt petits (un 3%) i que si això feia sortir “el goril·la de 400 quilos a ballar”, en referència a Google, ja ho donava per bo. Doncs sembla que el goril·la ha sortit a la pista borratxo d’IA i ha escombrat tothom. I això és un mal presagi per a OpenAI, però també per a Apple que hi està treballant i que al juny presenta novetats en IA.

Dic que el goril·la va sortir borratxo d’IA per que els 110 minuts que va ballar dimarts a la Google I/O (el maleït nom altra vegada), el terme IA es va mencionar 121 cops, més d’una vegada per minut. La dada no és meva, és de la gent de Techcrunch que es van entretenir a comptar-ho. Deu ser per això que van titular la secció on en parlaven com “AI ad nauseam”.

Google va presentar tot tipus de novetats; una finestra al futur immediat que ens espera: el bloc de notes LearnLM, capaç de “llegir”, “visionar” vídeos, “escoltar” lliçons i fer-nos-en lliçons, preguntes i conversar, adaptant-se així a les necessitats de cada estudiant; una plataforma per crear música generativa; un generador d’imatges amb uns resultats ultrarealistes; Veo, un model capaç de generar seqüències de fins a 60 segons. Hi va haver encara moltes més coses, però en voldria destacar dues més que crec que seran les que més impacte social tindran.

Demis Hasabis el CEO de Google DeepMind amb el seu fort accent britànic va presentar el Project Astra, el més espectacular (i del futur) que hi vam veure. En una demo en vídeo similar a la que havíem vist el dia abans d’OpenAI, s’hi veu una noia que, mòbil en mà, va filmant el seu entorn d’oficina i a l’ensems li va preguntant coses. Li demana “digue’m quan trobis alguna cosa que faci so” i Astra identifica un altaveu a sobre la taula; li demana que faci creació literària mentre enfoca un pot de colors i l’hi fa un haiku que totes les paraules comencen en ce; apunta el mòbil a una pantalla on hi ha el codi d’un programa i n’identifica la funcionalitat; apunta el mòbil a la finestra, li pregunta pel barri i Astra respon que li sembla que és King’s Cross, a Londres. Finalment li pregunta per on s’ha deixat les ulleres que han passat fugaçment davant la càmera mentre es dirigia cap a la finestra: “A sobre la taula, al costat de la poma vermella”. Impressiona molt, mireu-lo.

I si la demo d’Asta és d’allò més espectacular que mai hàgiu vist, Gemini, el xatbot que Google aplica a tot és el que té el potencial transformador més gran, més que res perquè tots som usuaris de Google. La cerca de Google, que cada cop és menys eficient, evoluciona cap a un model que s’assembla molt més a un ChatGPT que a Google tal i com el coneixem. I aquí OpenAI hi perd; el seu intent de connectar-lo amb la web mitjançant Bing empal·lideix davant la potència de Google i l’accés que té a informació en qualitat, quantitat i profunditat.

Vam veure una demostració de com serà la nova cerca: serà la IA qui faci la feina avorrida. Si fins ara per organitzar un viatge havíem d’anar fent cerques, saltar de web en web, llegir blogs de viatgers, comprar bitllets, i reservar hotels, a partir d’ara només caldrà demanar-li què volem i Gemini ens ho organitzarà. La demo que vam veure era d’algú que s’havia de traslladar a viure a Chicago: Google li organitzava la mudança, canvis d’adreça als diferents serveis en línia inclosos.

"La cerca de Google, que cada cop és menys eficient, evoluciona cap a un model que s’assembla molt més a un ChatGPT que a Google tal i com el coneixem"

Vist tot això vaig voler viatjar jo també al futur.

Vaig començar amb el flamant ChatGPT 4o i li vaig preguntar per les eleccions al Parlament de Catalunya. Ara té connexió a la web i no li va costar gens trobar-ne tota la informació amb el cercador Bing de Microsoft. Me’n va fer una crònica excel·lent: victòria del PSC, pujada del bloc independentista, pujada d’ERC i abstenció que va perjudicar al bloc unionista. Què? Resulta que la informació era de les eleccions del 2021. Me’n vaig adonar perquè havia seguit mínimament la campanya i l’escrutini. El periodista de Londres o l’alumne de ciències polítiques que faran copiar i enganxar es quedaran tan amples.

També li vaig demanar pel “nom del primer os que va travessar l’estret de Gibraltar”. Em va dir que es deia “Fulgencio” i que era una iniciativa per conscienciar sobre els reptes als que s’afronten els ossos polars per culpa del canvi climàtic.

Consulta de Josep M. Ganyet a ChatGPT 4o sobre el primer os que va travessar l’estret de Gibraltar

Ho vaig provar amb el Gemini de Google. Li vaig demanar que em preparés una ruta de 4 dies per a tres persones pel Peloponès, amb llocs d’interès, restaurants i hotels sense que em costés un ull de la cara. No vam començar bé perquè la primera recomanació que em va fer incloïa un dia a Atenes. L’hi vaig fer notar i em va fer un recorregut magnífic amb referències, fotografies, enllaços i càlcul de quant em gastaria en total. Una de les recomanacions era la del pintoresc poble d’Oia on em recomanava conduir després d’haver visitat les restes arqueològiques de Micenes. Bona, no el coneixia, tot i haver estat al Peloponès. No el coneixia perquè Oia és a l’illa de Santorini.

Quan treballava a IBM als anys 90 hi corria l’acudit de l’informàtic que en morir Sant Pere el deixa triar entre anar al cel o a l’infern. Li va mostrar el cel: fresquet, música de lira, àngels asexuats i sants calbs amb aurèola i barba. Després va baixar a l’infern i Pere Botero li va ensenyar: s’hi estava calentet, polsera de tot inclòs, hi sonava Disco Inferno de The Tramps amb les go-gos ballant a sobre les taules. Va tornar al cel per comunicar a Sant Pere que es decidia per l’infern. Quan hi va tornar hi va trobar les canòniques olles plenes de pecadors mentre els bollien. Enfadat, va preguntar a Pere Botero que què representava allò, que el que havia vist abans era molt diferent. Pere Botero li va replicar: “És que abans us hem ensenyat la demo”.