• Empresa
  • El giro de GPT-5 y su impacto en el mundo empresarial

El giro de GPT-5 y su impacto en el mundo empresarial

La esperada nueva familia de modelos generativos de OpenAI sorprende por el ligero salto de potencia respecto a los modelos anteriores y señala la eficiencia como nuevo campo de batalla

GPT-5 es la nueva apuesta de OpenAI para competir contra Grok, Gemini y Claude por el trono de la IA | hapabapa / iStock
GPT-5 es la nueva apuesta de OpenAI para competir contra Grok, Gemini y Claude por el trono de la IA | hapabapa / iStock
Marc Vilajosana, periodista de VIA Empresa | Mireia Comas
Periodista
Barcelona
16 de Agosto de 2025 - 05:30

Después de meses de espera, OpenAI desveló el pasado 7 de agosto GPT-5, la nueva familia de modelos de lenguaje extenso en los que se basan ChatGPT y el resto de herramientas de la compañía. Un anuncio que, como bien ha remarcado esta semana el etnógrafo digital y director de Mortensen Josep M. Ganyet en un artículo en VIA Empresa, ha sorprendido tanto a críticos como a fanáticos por el limitado incremento de potencia de cálculo que representa respecto a los anteriores modelos de la compañía. “Es un salto, pero no es una revolución como las que habíamos visto hasta ahora”, confirma el experto en transformación digital e innovación y profesor asociado en Gestión Pública en la UPF y Esade, Jordi Marin.

 

Como modelo más moderno del mercado, GPT-5 ha conseguido obtener la mejor puntuación en los principales tests de referencia del sector. El nuevo modelo de OpenAI lidera los rankings de razonamiento y conocimiento general (MMLU-Pro y Humanity’s Last Exam), razonamiento con contextos largos (AA-LCR), seguimiento de instrucciones (IFBench), matemáticas (AIME 2025) y código informático (SciCode). Sin embargo, es superado por Grok 4, el modelo más reciente de xAI, en el principal test de razonamiento científico (GPQA Diamond) y en el otro test de referencia vinculado a la programación (LiveCodeBench).

“Hay mejoras incrementales, pero no hay una mejora como la que vimos de GPT-3 al 4 o del 2 al 3, que prácticamente doblaban la capacidad. Es muy poquito, un tanto por ciento, y lo veo más como una estrategia de marketing”, señala Ganyet a VIA Empresa. Este hecho se puede observar en el siguiente gráfico elaborado por el portal Artificial Analysis, que elabora un índice de inteligencia a partir de las puntuaciones de los modelos de IA en los ocho tests mencionados en el anterior párrafo. A pesar de que GPT-5 se posiciona hoy como el modelo con mejor valoración, la distancia con los modelos o3 y o3-mini de la misma OpenAI es mínima.

 
Gráfico comparativo de la evaluación de los diferentes modelos de IA con el paso del tiempo. En negro, los modelos de OpenAI; el último ítem corresponde a GPT-5 | Artificial Analysis
Gráfico comparativo de la evaluación de los diferentes modelos de IA con el paso del tiempo. En negro, los modelos de OpenAI; el último ítem corresponde a GPT-5 | Artificial Analysis

Otro de los puntos que no han convencido a los usuarios es la velocidad del modelo. De acuerdo con los tests elaborados por Artificial Analysis, la velocidad de tokens por segundo que genera la familia de GPT-5 es especialmente baja entre los modelos más pesados, superada por la mayoría de alternativas, mientras que los más ligeros son sobrepasados por el modelo de razonamiento de Gemini 2.5 Flash de Google, que lidera la tabla. 

Como aspectos positivos, Marin destaca el aumento de la capacidad de contexto de GPT-5, que va de los 8.000 tokens en la versión gratuita hasta los 128.000 en el plan para empresas, con un límite de 32.000 en la suscripción Plus. A escala de usuario, también valora positivamente la capacidad multimodal de la herramienta y su integración con otros entornos digitales como Google Drive, Microsoft Teams y SharePoint o GitHub, entre otros.

Una apuesta por la eficiencia

Estas mejoras reducidas son, según Ganyet, una señal de que “estamos tocando techo”, una visión que hace tiempo que defienden voces críticas como el psicólogo y científico cognitivo Gary Marcus. “Desde un punto de vista científico, esto es así, las escalas no son nunca exponenciales, siempre son en forma de ese y se acaban aplanando”, recalca el director de Mortensen. “Es lógico”, apunta por su parte Marin, “revoluciones de capacidades de la IA generativa ya hemos visto muchas, y ahora seguramente estamos viendo perfeccionamientos: más capacidad de análisis, de mejorar las respuestas, integración con otras herramientas, más intermodalidad o más adaptación o personalización”.

Ante este contexto, la apuesta de OpenAI ha virado hacia mejorar la eficiencia de estos modelos, un ámbito en el que GPT-5 sí que ha destacado positivamente. “Más usuarios tienen acceso a los modelos más avanzados, y a los de pago no les bajan las cuotas, pero tienen unas cuotas de utilización más altas”, explica Ganyet. Los precios también son más competitivos: en su versión para desarrolladores, GPT-5 tiene un coste de input de 1,25 dólares por millón de tokens, cosa que lo sitúa sensiblemente por debajo de competidores como Grok 4 y Claude 4 Sonnet Thinking (3 dólares) y a la misma escala que Gemini 2.5 Pro. La comparación se acentúa con los anteriores modelos de OpenAI: GPT-4 tenía un coste de 30 dólares por millón de tokens; GPT-4o, de 2,5 dólares; el modelo de razonamiento o3, 2 dólares (20 en la versión pro), y el reciente GPT-4.1, también de 2 dólares.

Una de las claves de esta reducción se encuentra en el nuevo enrutador que utiliza ChatGPT con GPT-5. Este sistema sustituye la anterior elección manual de los múltiples modelos disponibles por el usuario por una elección automática, que escoge un modelo de más o menos potencia, generalista o de razonamiento profundo, en función de la petición del usuario. Este modelo interno busca simplificar las tareas a los usuarios menos técnicos y, a la vez, ahorrar costes. “Han revisado la cadena cognitiva y ya no tienes que ir pescando modelos: ahora todo es GPT-5. Esto, para mí, es una ventaja, aunque muchos usuarios se quejan porque ya sabían cuáles utilizar, y ahora piden que vuelvan a poner el selector”, comenta Ganyet. Este sistema automático generalmente hace pasar al usuario por los modelos más ligeros, ya que “la mayor parte de gente no necesita modelos de razonamiento avanzado para generar cuatro textos”. Sin embargo, existe un truco para forzar el sistema a utilizar modelos más avanzados sin tener que recurrir a la suscripción de pago: acompañar los apuntes con frases como “piensa bien tu respuesta”.

Ganyet: "La eficiencia es un campo para explorar y donde hay un margen de mejora sensible"

Para el director de Mortensen, la apuesta de OpenAI por intentar liderar el campo de la eficiencia es el movimiento lógico: “Es un campo para explorar y donde hay un margen de mejora sensible. Que cada entrenamiento sea más barato, que el entrenamiento por refuerzo también sea más barato y eficiente, y que cada apunte cueste menos. No sé si la vía es el del modelo discriminador, el de unos modelos previos que entiendan qué estás pidiendo o si hay otros modelos, pero seguro que uno de los campos de mejora es el de eficiencia”.

GPT-5 en el contexto empresarial

¿Y cómo afectan todos estos cambios al usuario de ChatGPT, especialmente a aquellos que lo emplean en su día a día laboral? Ganyet considera que el gran cambio que habrán notado las personas asiduas a la herramienta es la implementación del enrutador, hecho que los ha liberado de tener que elegir qué modelo utilizar. Marin valora el aumento de la capacidad de contexto, “que en el mundo corporativo quiere decir que las respuestas son mucho mejores”, y también la integración con herramientas de terceros, las cuales ayudarán a “mejorar aún más la productividad”.

Con todo, los posibles usos que empresarios y trabajadores pueden hacer de los modelos de lenguaje generativos no han experimentado ningún gran cambio con la llegada de GPT-5. Marin cree que se mantienen las funciones principales, que agrupa en la asistencia en procesos y tareas complejas; la analítica de grandes volúmenes de datos en tiempo real, con detección de tendencias y predicciones de riesgos; y la personalización de la experiencia con el usuario. Eso sí, el experto deja claro la importancia de integrar todas estas herramientas siempre a partir de una estrategia unificada dentro de la empresa: “Demos las herramientas a la gente, que son una pasada y transforman y ayudan, pero hagámoslo de manera corporativa, porque si no la gente se espabila y lo acaba haciendo de manera individual, y podemos tener problemas de seguridad”.

Lo que tampoco han cambiado son sus riesgos. “No es una herramienta omnipotente ni 100% fiable, así que vigila con lo que le encargues”, alerta Ganyet, quien recuerda que “las alucinaciones son inherentes a la IA generativa” y no es fácil combatirlas, una línea de actuación que exige “generar más respuestas y compararlas mejor”, cosa que “no está en la línea de la eficiencia” que parece querer impulsar OpenAI. El director de Mortensen también advierte sobre el peligro de generar una dependencia excesiva a la inteligencia artificial: “Los días que ChatGPT no va, vas a las redes y la gente te dice que no puede trabajar, que tenía que acabar una presentación, y que ahora cómo hago para leer todos estos PDF. Está muy bien en determinadas circunstancias, pero una dependencia excesiva te puede hacer bajar la guardia del espíritu crítico y a no poder trabajar sin ChatGPT”.

Más allá del usuario generalista, donde sí que se ha producido un cambio importante para Ganyet es en el ámbito de los usuarios profesionales que trabajan con la herramienta desde la vertiente de desarrolladores. Y este no ha llegado por el lanzamiento de GPT-5, sino por la publicación en abierto de gpt-oss-20b y gpt-oss-120b, los primeros modelos extensos de lenguaje que OpenAI publica en código abierto desde 2022, año en que se publicó GPT-2. “Hay una versión compacta que funciona incluso en tu portátil, sin GPU, y es bastante competitiva comparada con Llama, DeepSeek o Mistral”, considera Ganyet. Este movimiento es relevante por la maniobrabilidad que otorga a los desarrolladores: “Lo podrán tener en su servidor, totalmente privado, de manera eficiente y, si es necesario, podrán reprogramar los pesos, porque lo han publicado absolutamente todo”. Un movimiento que el experto compara al de DeepSeek y que posiciona los modelos abiertos como un nuevo frente de la batalla por la supremacía de la IA. “Con la boca pequeña, recuperan el nombre de Open”, concede.