Una companya que treballa a Shopify m’explica com funciona el seu equip de disseny de producte. Primer dissenyen a mà, en paper o en iPad o tauleta gràfica, com sempre, però sense utilitzar cap programa de disseny massa sofisticat. Després, passen el disseny a la IA de Claude Code, que genera un prototip funcional ja programat. Els programadors agafen el prototip i el refinen.
Fins aquí, res que no hagi vist abans a la meva empresa. Però hi ha un bonus track: el consum de tokens és públic. Tothom a l'empresa pot consultar quants tokens ha consumit cadascú. Hi ha empreses, em va dir, que ho posen en pantalles a l'oficina amb la classificació en temps real de qui gasta més en IA.
El que la meva companya m’explicava té un nom i a Silicon Valley el sap tothom: tokenmaxxing. El terme combina token —la unitat mínima de text que processen els models de llenguatge, uns pocs caràcters— amb el sufix -maxxing de l'argot Gen Z: maximitzar quelcom fins al límit. Busqueu a TikTok o a Instagram looksmaxxing o hardmaxxing i proveu de no pensar en l’extinció.
L'origen de tots els mals (un cop més) és Meta. Un empleat va construir a l’abril un tauler intern anomenat “Claudeonomics” que classificava els companys per consum de tokens. El líder havia consumit 281.000 milions de tokens en 30 dies, que traduït a diners equival a un cost d’entre 1,5 i 3 milions de dòlars. En un mes. Si no és or el que genera aquest “token legend” (aquest és el títol intern), no em surten els números.
Com que això de mesurar la productivitat a partir de quant gasten els treballadors en IA ha corregut per Silicon Valley ja n’hi ha que han hackejat el sistema. Empleats d’Amazon fan servir MeshClaw —una eina interna d'Amazon per gestionar agents— per a tasques innecessàries, només per inflar el comptador. L'empresa havia exigit als seus desenvolupadors que usessin IA cada setmana i, com Meta, en publicava els resultats en una classificació interna. “Hi ha una pressió enorme per usar aquestes eines”, diu un treballador al Financial Times. Microsoft, OpenAI o Sequoia Capital també tenen la seva classificació de “tokens legends”.
"Empleats d’Amazon fan servir MeshClaw —una eina interna d'Amazon per gestionar agents— per a tasques innecessàries, només per inflar el comptador d'usos de 'tokens' d'IA"
Distopia Orwel·liana amb panòptic de Bentham? Molt pitjor.
Mesurar la productivitat per tokens consumits és l'equivalent contemporani de mesurar la productivitat dels programadors per línies de codi escrites. Aquesta mètrica va ser popular als anys vuitanta i noranta. La indústria la va abandonar aviat perquè era òbviament falsa: un programa eficient, en general, té menys línies de codi (si sou programadors, un concepte clau: expressions regulars). A l’infame Elon Musk, quan el 2022 va comprar Twitter, encara no li havia arribat: acomiadava programadors si trobava que la quantitat de línies de codi escrites el darrer mes era baixa.
Un estudi de 22.000 desenvolupadors de la plataforma Faros mostra com l'ús d'IA accelera la producció: les tasques completades pugen un 34%, però els errors per desenvolupador augmenten un 54% i el temps de revisió de codi es multiplica per cinc. Més tokens, més volum, més bugs, més feina per netejar per a humans que fan de robots. La llei de Goodhart diu que quan una mesura es converteix en objectiu, deixa de ser una bona mesura. Si al fabricant de clips de paper li dius que el mesuraràs per acer consumit, la solució òptima és fabricar un sol clip gegant. Aquests hacks al sistema passaven a l’economia soviètica com avui passen a Amazon amb el MeshClaw.
Jensen Huang, de Nvidia —que el tenim acompanyant Trump al seu viatge a la Xina—, diu que estaria “profundament alarmat” si un enginyer de 500.000 dòlars anuals no consumís almenys 250.000 dòlars en tokens. Nvidia, recordem, ven les GPU que processen tots aquests tokens. Em sona.
"Mesurar la productivitat per 'tokens' consumits és l'equivalent contemporani de mesurar la productivitat dels programadors per línies de codi escrites"
El 1848, quan es va descobrir or a Califòrnia, desenes de milers de persones van abandonar-ho tot per anar a buscar fortuna. La majoria van tornar amb les mans a les butxaques, o no van tornar. Els que van fer diners de debò van ser els que venien les pales, els porgadors, les botes i els pantalons soferts: Levi Strauss va muntar un negoci de roba de treball per als miners i avui és una marca global. El mitjà és el negoci.
Anthropic —que fabrica Claude, el model darrere de bona part d'aquest consum— va duplicar les seves projeccions d'ingressos en dos mesos, principalment gràcies a Claude Code, una assistent de programació que sembla màgic. OpenAI ha triplicat els usuaris actius del seu assistent Codex des de principis d'any. Com més tokenmaxxing hi hagi al món, millor per als comptes de resultats d'Anthropic i OpenAI. Ells venen les pales.
La despesa prevista combinada d'Amazon, Microsoft, Alphabet i Meta en centres de dades, xips, servidors, equipament de xarxa i infraestructura d'energia i refrigeració se situa al voltant dels 700.000 milions de dòlars per a 2026 i el bilió el 2027. Aquests números assumeixen que la demanda de còmput d'IA és real i creixent. Suposo que ja tenen en compte el consum de pega; el dels empleats inflant comptadors per quedar bé en un tauler. Les projeccions sobre les quals s'assenten centenars de milers de milions en inversió s’haurien de corregir amb els efectes de mesurar allò que no toca, els efectes de la llei de Goodhart.
"Com més 'tokenmaxxing' hi hagi al món, millor per als comptes de resultats d'Anthropic i OpenAI. Ells venen les pales"
Les pantalles a les oficines amb les classificacions dels “tokens legends” recorden les pantalles de borsa als lobbies dels bancs d'inversió el 2007. Tothom mirant pujar uns números que no representaven cap cosa real.
Molts miners van morir sols i pobres, però amb uns Levi’s a sobre.