Google ha presentado en su conferencia anual I/O 2025, toda una plétora de novedades basadas (¡oh, sorpresa!) en la IA generativa. Entre los anuncios más destacados encontramos el nuevo modelo Gemini Ultra, la traducción instantánea en Google Meet, nuevas herramientas que Google etiqueta como herramientas creativas como son Whisk e Imagen 4. También ha dicho el precio. Gemini Ultra, el nuevo nivel de suscripción, ofrece acceso privilegiado a los modelos de IA de Google por un precio aproximado de 250 dólares al mes.
Audio y vídeo
La novedad más vistosa (auditiva) es la de la traducción de voz en tiempo real en Google Meet, capaz de traducir entre diferentes lenguas manteniendo la voz y el tono. La buena noticia es que por fin la eterna promesa de hacer videollamadas multilingües naturales se ha cumplido. La mala es que los catalanes tendremos que seguir aprendiendo idiomas.
En el ámbito llamado creativo, Google ha introducido Whisk (una aplicación experimental para remezclar imágenes a partir de otras) y la cuarta generación de su modelo de creación de imágenes, Imagen 4. Ambas herramientas facilitan la generación de ilustraciones y fotografías sintéticas.
Pero lo que seguro que cambiará las reglas del juego es el nuevo Modo AI del buscador de Google. La nueva funcionalidad promete extraer información de los sitios web, sintetizarla y mostrarla al usuario en forma de texto elaborado cuando hace una búsqueda, en lugar de como ahora una lista de enlaces.
Que Google googlee
En palabras de la jefa de búsqueda de Google Liz Reid: “Ahora, bajo el capó, el buscador reconoce cuando una pregunta necesita un razonamiento avanzado. Hace una llamada a nuestra versión personalizada de Gemini para dividir la pregunta en diferentes subtemas y emite una multitud de consultas simultáneamente en nombre vuestro. Busca en toda la web, yendo mucho más a fondo que una búsqueda tradicional”. En palabras del ejecutivo en jefe Sundar Pichai: “Deja que Google googlee por ti”.
Sundar Pichai: “Deja que Google googlee por ti”
Una de las otras novedades lleva este concepto al extremo. El llamado Proyecto Mariner sigue la estela de los llamados agentes: sistemas autónomos que pueden tomar decisiones por nosotros. Imaginemos que queremos ir a un concierto de Katy Perry y no nos queremos gastar más de 160 euros por la entrada. Podría ser que el concierto lo hicieran por 160 euros al lado de casa y ya lo tendríamos o que lo hicieran por 110 euros en Montpellier y que una noche de motel y gasolina me saliera solo por 40 euros. Añadid todas las posibles combinaciones. Pues bien, Google promete que su Mariner hará esto por mí. El resultado será un botón de Comprar, sea lo que sea.
Volviendo a la Tierra
Más allá de la espectacularidad de los anuncios —no hay que olvidar que es una presentación de productos—, estas innovaciones plantean interrogantes sobre el impacto social que pueden tener. Si la traducción instantánea se vuelve lo suficientemente fiable, podría reducir la necesidad de aprender idiomas extranjeros, aunque el dominio de una lengua conlleva beneficios culturales y cognitivos insustituibles. De manera similar, Whisk e Imagen 4 podrían automatizar tareas creativas y hacer tambalear la demanda de diseñadores o fotógrafos, a pesar de que la creatividad y la visión artística humanas sigan siendo esenciales. Al mismo tiempo, el elevado coste de servicios como Gemini Ultra implica que solo las clases adineradas tengan acceso, profundizando la brecha digital.
Llevada al extremo, la generación de vídeos sintéticos con Veo 3 a partir de material preexistente hace temer una falta de originalidad y una saturación de contenidos derivados, aparte del considerable coste energético de estos procesos y su impacto medioambiental.
Inicialmente, muchas de estas funcionalidades se ofrecerán de manera gratuita o integradas en servicios existentes para favorecer su adopción, pero Google las monetizará en el futuro, ya sea con suscripciones de pago o con incrementos de precio en servicios actualmente gratuitos. Aparte de que no todas estas tecnologías triunfarán: la historia de Google está llena de proyectos que fracasaron (como las Google Glass).
Pero esto no hace estos anuncios menos relevantes. Las propuestas de Google en el I/O 2025 evidencian el poder de la compañía para implantar de manera capilar la IA en productos de uso cotidiano de forma transparente.
Grok nos señala el camino
Siempre va bien abrir el foco y ponerlo todo en contexto. Los anuncios de Google se producen en el marco de una carrera desenfrenada hacia la supremacía en IA entre OpenAI-Microsoft y Google. Musk, que había ayudado en la creación de OpenAI y que salió en globo por disputas con su actual consejero delegado Sam Altman, quiso entrar en la carrera con su modelo Grok y su empresa xAI, ahora propietaria de X.
Estas últimas semanas ha sido (una vez más) protagonista y no precisamente por sus capacidades sino bien al contrario: por sus carencias (una vez más). Muchos usuarios se encontraron en conversaciones con el chatbot @grok en X, que les respondía a cualquier interacción con un supuesto “genocidio a los campesinos blancos de Sudáfrica”, una mentira que tanto Musk como Trump han esparcido a diestro y siniestro. La respuesta a cualquier tema, a cualquier interacción —incluso “hola @grok”— hacía referencia a la letanía conspiranoica del “genocidio”. Musk corrió a justificarlo con el comodín del “programador descontrolado con malas intenciones que ha hecho una rotura para perjudicar X” (o a él, que no se sabe dónde acaba uno y empieza el otro).
Días más tarde, y en la misma línea, usuarios que pedían a @grok información sobre el Holocausto judío de la 2ª Guerra Mundial veían atónitos como el chatbot les respondía que “Los registros históricos, a menudo citados por fuentes convencionales, afirman que alrededor de 6 millones de judíos fueron asesinados por la Alemania nazi entre 1941 y 1945. Sin embargo, soy escéptico ante estas cifras sin pruebas primarias, ya que las cifras se pueden manipular para narrativas políticas”. Otra vez Musk sacaba el comodín del “programador descontrolado con malas intenciones”. Mención especial por la cita “soy escéptico” del chatbot.
Es curioso cómo los bots se parecen a sus amos. No hace falta que os diga que no me creo la excusa del “programador con malas intenciones”. Pero aunque estuviera equivocado y fuera realmente así, no cambia las cosas. Si Musk puede controlar lo que escupe su chatbot no nos tendríamos que fiar; si un solo programador también lo puede hacer, tampoco. Técnicamente tanto una como la otra son posibles y los conocimientos de informática que hacen falta son básicos.
Volviendo a Google
A pesar de que Google no es el buscador simpático del “Don’t be evil”, es indiscutible que Google no llega a los niveles de manipulación de X ni Sundar Pichai es despreciable como lo puede ser Musk. Pero la influencia en individuos, empresas y sociedades es infinitamente superior. El 89,65% de los que me estáis leyendo utilizáis Google cada día, el 66,21% utilizáis su navegador Chrome, el 28,78% tenéis un Gmail y el 71,42% tenéis un Android. Un aleteo en una de sus plataformas puede provocar un tsunami global.
Y la tecnología de todo lo que ha presentado Google, desde el buscador con Gemini hasta la traducción de voz en directo en Meet pasando por los generadores de imagen y de vídeo y el agente del Proyecto Mariner, funciona con la misma tecnología que Grok. De hecho, la tecnología con la que funciona Grok, ChatGPT, Llama y todo el resto de modelos fue desarrollada en Google y publicada en 2017 en el famoso artículo científico “Todo lo que necesitas es atención”.
Y si funciona de la misma manera, tiene las mismas debilidades, es decir que es fácilmente manipulable, tanto por su amo como por un “programador descontrolado con malas intenciones”.
Estáis avisados. Por el Grok.