VIA Tech

El gir de GPT-5 i el seu impacte pel món empresarial

L’esperada nova família de models generatius d’OpenAI sorprèn pel lleuger salt de potència respecte als models anteriors i assenyala l’eficiència com a nou camp de batalla

GPT-5 és la nova aposta d'OpenAI per competir amb Grok, Gemini i Claude pel tron de la IA | hapabapa / iStock

Marc Vilajosana

Periodista

Barcelona

16 d'Agost de 2025 - 05:30

Després de mesos d’espera, OpenAI va desvelar el passat 7 d’agost GPT-5, la nova família de models de llenguatge extens en els quals es basen ChatGPT i la resta d’eines de la companyia. Un anunci que, com bé ha remarcat aquesta setmana l’etnògraf digital i director de Mortensen Josep M. Ganyet en un article a VIA Empresa, ha sorprès tant crítics com fanàtics pel limitat increment de potència de càlcul que representa respecte als anteriors models de la companyia. “És un salt, però no és una revolució com les que havíem vist fins ara”, confirma l’expert en transformació digital i innovació i professor associat en Gestió Pública a la UPF i Esade, Jordi Marin.

Com a model més modern del mercat, GPT-5 ha aconseguit obtenir la millor puntuació en els principals testos de referència del sector. El nou model d’OpenAI lidera els rànquings de raonament i coneixement general (MMLU-Pro i Humanity’s Last Exam), raonament amb contextos llargs (AA-LCR), seguiment d’instruccions (IFBench), matemàtiques (AIME 2025) i codi informàtic (SciCode). Tanmateix, és superat per Grok 4, el model més recent de xAI, en el principal test de raonament científic (GPQA Diamond) i en l’altre test de referència vinculat a la programació (LiveCodeBench).

“Hi ha millores incrementals, però no hi ha una millora com la que vam veure de GPT-3 al 4 o del 2 al 3, que pràcticament doblaven la capacitat. És molt poquet, un tant per cent, i ho veig més com una estratègia de màrqueting”, assenyala Ganyet a VIA Empresa. Aquest fet es pot observar en el següent gràfic elaborat pel portal Artificial Analysis, que elabora un índex d’intel·ligència a partir de les puntuacions dels models d’IA en els vuit testos mencionats en l’anterior paràgraf. Malgrat que GPT-5 es posiciona avui com al model amb millor valoració, la distància amb els models o3 i o3-mini de la mateixa OpenAI és mínima.

Gràfic comparatiu de l’avaluació dels diferents models d’IA amb el pas del temps. En negre, els models d’OpenAI; el darrer ítem correspon a GPT-5 | Artificial Analysis

Un altre dels punts que no han convençut els usuaris és la velocitat del model. D’acord amb els testos elaborats per Artificial Analysis, la velocitat de tokens per segon que genera la família de GPT-5 és especialment baixa entre els models més pesants, superada per la majoria d’alternatives, mentre que els més lleugers són sobrepassats pel model de raonament de Gemini 2.5 Flash de Google, que lidera la taula.

Com a aspectes positius, Marin destaca l’augment de la capacitat de context de GPT-5, que va dels 8.000 tokens en la versió gratuïta fins als 128.000 en el pla per a empreses, amb un límit de 32.000 en la subscripció Plus. A escala d’usuari, també valora positivament la capacitat multimodal de l’eina i la seva integració amb altres entorns digitals com Google Drive, Microsoft Teams i SharePoint o GitHub, entre altres.

Una aposta per l’eficiència

Aquestes millores reduïdes són, segons Ganyet, un senyal que “estem tocant sostre”, una visió que fa temps que defensen veus crítiques com el psicòleg i científic cognitiu Gary Marcus. “Des d’un punt de vista científic això és així, les escales no són mai exponencials, sempre són en forma de essa i s’acaben aplanant”, recalca el director de Mortensen. “És lògic”, apunta per la seva banda Marin, “revolucions de capacitats de la IA generativa ja n’hem vist moltes, i ara segurament estem veient perfeccionaments: més capacitat d’anàlisi, de millorar les respostes, integració amb altres eines, més intermodalitat o més adaptació o personalització”.

Davant d’aquest context, l’aposta d’OpenAI ha virat cap a millorar l’eficiència d’aquests models, un àmbit en què GPT-5 sí que ha destacat positivament. “Més usuaris tenen accés als models més avançats, i als de pagament no els baixen les quotes, però tenen unes quotes d’utilització més altes”, explica Ganyet. Els preus també són més competitius: en la seva versió per a desenvolupadors, GPT-5 té un cost d’input d’1,25 dòlars per milió de tokens, cosa que el situa sensiblement per sota de competidors com Grok 4 i Claude 4 Sonnet Thinking (3 dòlars) i a la mateixa escala que Gemini 2.5 Pro. La comparació s’accentua amb els anteriors models d’OpenAI: GPT-4 tenia un cost de 30 dòlars per milió de tokens; GPT-4o, de 2,5 dòlars; el model de raonament o3, 2 dòlars (20 en la versió pro), i el recent GPT-4.1, també de 2 dòlars.

Una de les claus d’aquesta reducció es troba en el nou encaminador que fa servir ChatGPT amb GPT-5. Aquest sistema substitueix l’anterior elecció manual dels múltiples models disponibles per l’usuari per una elecció automàtica, que escull un model de més o menys potència, generalista o de raonament profund, en funció de la petició de l’usuari. Aquest model intern busca simplificar les tasques als usuaris menys tècnics i, alhora, estalviar costos. “Han revisat la cadena cognitiva i ja no has d’anar pescant models: ara tot és GPT-5. Això, per mi, és un avantatge, tot i que molts usuaris es queixen perquè ja sabien quins fer servir, i ara demanen que tornin a posar el selector”, comenta Ganyet. Aquest sistema automàtic generalment fa passar l’usuari pels models més lleugers, ja que “la major part de gent no necessita models de raonament avançat per generar quatre textos”. Tanmateix, existeix un truc per forçar el sistema a fer servir models més avançats sense haver de recórrer a la subscripció de pagament: acompanyar els apunts amb frases com “pensa bé la teva resposta”.

Ganyet: "L'eficiència és un camp per explorar i on hi ha un marge de millora sensible"

Pel director de Mortensen, l’aposta d’OpenAI per intentar liderar el camp de l’eficiència és el moviment lògic: “És un camp per explorar i on hi ha un marge de millora sensible. Que cada entrenament sigui més barat, que l’entrenament per reforç també sigui més barat i eficient, i que cada apunt costi menys. No sé si la via és el del model discriminador, el d’uns models previs que entenguin què estàs demanant o si hi ha altres models, però segur que un dels camps de millora és el d’eficiència”.

GPT-5 en el context empresarial

I com afecten tots aquests canvis a l'usuari de ChatGPT, especialment a aquells que l'empren en el seu dia a dia laboral? Ganyet considera que el gran canvi que hauran notat les persones assídues a l'eina és la implementació de l'encaminador, fet que els ha alliberat d'haver de triar quin model fer servir. Marin valora l’augment de la capacitat de context, “que al món corporatiu vol dir que les respostes són molt millors”, i també la integració amb eines de tercers, les quals ajudaren a “millorar encara més la productivitat”.

Amb tot, els possibles usos que empresaris i treballadors poden fer dels models de llenguatge generatius no han experimentat cap gran canvi amb l'arribada de GPT-5. Marin creu que es mantenen les funcions principals, que classifica entre l’assistència en processos i tasques complexes; l’analítica de grans volums de dades en temps real, amb detecció de tendències i prediccions de riscos; i la personalització de l’experiència amb l’usuari. Això sí, l’expert deixa clar la importància d’integrar totes aquestes eines sempre a partir d’una estratègia unificada dins l’empresa: “Donem les eines a la gent, que són una passada i transformen i ajuden, però fem-ho de manera corporativa, perquè si no la gent s’espavila i ho acaba fent de manera individual, i podem tenir problemes de seguretat”.

El que tampoc han canviat són els seus riscos. “No és una eina omnipotent ni 100% fiable, així que vigila amb el que li encarreguis”, alerta Ganyet, qui recorda que “les al·lucinacions són inherents a la IA generativa” i no és fàcil combatre-les, una línia d'actuació que exigeix “generar més respostes i comparar-les millor”, cosa que “no està en la línia de l’eficiència” que sembla voler impulsar OpenAI. El director de Mortensen també adverteix sobre el perill de generar una dependència excessiva a la intel·ligència artificial: “Els dies que ChatGPT no va, vas a les xarxes i la gent et diu que no pot treballar, que havia d’acabar una presentació, i que ara com ho faig per llegir tots aquests PDF. Està molt bé en determinades circumstàncies, però una dependència excessiva et pot fer baixar la guàrdia de l’esperit crític i a no poder treballar sense ChatGPT”.

Més enllà de l'usuari generalista, on sí que s'ha produït un canvi important per Ganyet és en l'àmbit dels usuaris professionals que treballen amb l'eina des del vessant de desenvolupadors. I aquest no ha arribat pel llançament de GPT-5, sinó per la publicació en obert de gpt-oss-20b i gpt-oss-120b, els primers models extensos de llenguatge que OpenAI publica en codi obert des de 2022, any en què es va publicar GPT-2. “Hi ha una versió compacta que funciona fins i tot al teu portàtil, sense GPU, i és força competitiva comparada amb Llama, DeepSeek o Mistral”, considera Ganyet. Aquest moviment és rellevant per la maniobrabilitat que atorga als desenvolupadors: “El podran tenir al seu servidor, totalment privat, de manera eficient i, si cal, podran reprogramar els pesos, perquè ho han publicat absolutament tot”. Un moviment que l’expert compara al de DeepSeek i que posiciona els models oberts com un nou front de la batalla per la supremacia de la IA. “Amb la boca petita, recuperen el nom d’Open”, concedeix.