• La IA piensa en inglés: ¿qué pasa con nuestra cultura?

La IA piensa en inglés: ¿qué pasa con nuestra cultura?

Si no alimentamos esta tecnología con nuestras lenguas, referentes y valores, cada vez será más difícil reconocernos en ella

¿Quién habla cuando habla la IA? ¿Qué mirada del mundo nos devuelve? | iStock
¿Quién habla cuando habla la IA? ¿Qué mirada del mundo nos devuelve? | iStock
Silvia Urarte
Fundadora y directora general de la consultora Conética
18 de Noviembre de 2025 - 04:55

La inteligencia artificial se ha convertido en un narrador global. El problema es que este narrador habla, sobre todo, en inglés. Y cuando habla en inglés, ¿qué pasa con nuestras lenguas, nuestras empresas y nuestra cultura?

 

La inteligencia artificial ya no es solo una herramienta para redactar correos o resumir informes. Poco a poco, se ha convertido en un filtro del conocimiento, del arte y de la memoria colectiva. La pregunta es inevitable: ¿quién habla cuando habla la IA? ¿Qué mirada del mundo nos devuelve? La respuesta incomoda: hoy la IA piensa -y nos hace pensar- en inglés. Y esto tiene consecuencias muy reales.

Los grandes modelos de lenguaje se entrenan con cantidades ingentes de textos que circulan por internet. Meta reconoció que LLaMA 2 se entrenó con casi un 90% de datos en inglés. OpenAI, en el caso de GPT-3 (el último modelo con cifras transparentes), admitió que más del 92% de su corpus era en inglés, y apenas un 0,77% en castellano. Con GPT-4 y GPT-5 no tenemos datos oficiales, pero todo apunta a lo mismo: el inglés sigue siendo la lengua dominante, aunque se intente añadir diversidad con traducciones o datos sintéticos. En otras palabras: lo que “sabe” la IA lo ha aprendido sobre todo de textos norteamericanos y británicos. No refleja una visión global, sino una visión globalizada desde el anglosajón.

 

Lo que “sabe” la IA lo ha aprendido sobre todo de textos norteamericanos y británicos. No refleja una visión global, sino una visión globalizada desde el anglosajón

Esto se nota cuando pedimos a la IA que nos hable de referentes culturales. No evalúa el mérito artístico, sino la frecuencia de aparición en los datos. Salvador Dalí, con una hemeroteca de más de 74.000 artículos digitalizados en la Fundación Gala-Salvador Dalí y presencia en más de 100 idiomas en la Wikipedia, puede quedar eclipsado por Georgia O’Keeffe, cuya obra está ampliamente documentada en inglés y ocupa más espacio en corpus anglosajones. La diferencia no está en la relevancia cultural, sino en el idioma de los textos que alimentan el algoritmo. Dalí está sobradamente documentado, pero gran parte de su archivo está en catalán, castellano o francés, lenguas que apenas representan un 10% del entrenamiento. O’Keeffe, en cambio, aparece constantemente en fuentes norteamericanas, y eso la hace más visible para la IA. Al final, quien no aparece en inglés aparece menos en el relato algorítmico.

El problema se agrava en lenguas con poco peso digital. El catalán, por ejemplo, representa menos del 0,1% del contenido indexado en internet, frente al 5,6% del castellano y más del 44% del inglés, según la Fundación Rafael del Pino. Esto tiene efectos directos: un estudiante que redacta su TFG en catalán y utiliza una IA generativa obtendrá respuestas menos precisas, con errores o limitaciones de estilo. Profesionales que trabajan en catalán encontrarán menos apoyo automatizado para redactar, resumir o generar ideas. La IA malinterpreta expresiones culturales, giros lingüísticos y referentes locales. Cuando la IA no entiende tu lengua, tampoco entiende tu cultura.

La diferencia no está en la relevancia cultural, sino en el idioma de los textos que alimentan el algoritmo. Dalí está sobradamente documentado, pero gran parte de su archivo está en catalán, castellano o francés

Europa ha intentado marcar una diferencia con leyes como el Reglamento General de Protección de Datos o la reciente Ley de inteligencia artificial, centradas en la ética y la transparencia. Pero si las herramientas que usamos están entrenadas desde Silicon Valley, en inglés y con marcos culturales ajenos, ¿qué soberanía nos queda?

La alternativa no está solo en competir en volumen de datos, sino en construir una IA que respete la diversidad cultural y lingüística. Iniciativas como el modelo Aina, para el catalán, o el modelo Mistral, en el ámbito europeo, son señales de que hay otro camino posible.

La conclusión es sencilla y contundente: una cultura que no se entrena desaparece del relato. La inteligencia artificial no es neutral: refleja exactamente el mundo que le damos a leer. Si no la alimentamos con nuestras lenguas, nuestros referentes y nuestros valores, cada vez será más difícil reconocernos en ella. Porque una tecnología que no nos representa acaba distorsionando lo que somos. El futuro no se limita a programarse: también se narra. Y ha llegado el momento de asegurarnos de que nuestras historias estén presentes en esta narración.