L’art de fer diccionaris: de la calaixera de mossèn Alcover al ChatGPT

No hi ha dubte que l’evolució tecnològica ha capgirat els darrers anys la manera de fer de la majoria d’oficis i que les innovacions en intel·ligència artificial auguren que cap feina, per qualificada i creativa que sigui, no estarà exempta de ser feta d’una manera més eficient amb l’ajut d’un enginy, o bé directament per l’enginy.

Aquest seria el cas de l’activitat en què em voldria centrar avui: l’art de fer diccionaris especialitzats, que s’ha pogut beneficiar molt aquests darrers anys dels avenços tecnològics.

Queden molt lluny les metodologies emprades pels lexicògrafs del segle passat, com mossèn Alcover, artífex d’un dels diccionaris més colossals fets mai en una llengua romànica: el Diccionari català-valencià-balear. És famosa la calaixera en què emmagatzemava els milers de registres que li feien arribar els seus col·laboradors d’arreu del territori, amb l’ús dels mots en els diversos indrets. És especialment coneguda perquè la va traginar de Mallorca a Barcelona mentre era president de la Secció Filològica de l’Institut d’Estudis Catalans i, quan es va barallar amb Pompeu Fabra pel model de llengua catalana que defensaven cadascú, se la va tornar a emportar cap a les Illes. Avui dia, és clar, hauria tingut tota la informació al núvol i s’hauria estalviat uns quants maldecaps en transport.

De fet, des dels anys vuitanta del segle passat la terminologia es treballa en programes específics que et permeten emmagatzemar les fitxes i després seleccionar-les des de diversos paràmetres. És molt útil per millorar la qualitat d’un diccionari poder revisar tots els termes d’una mateixa branca temàtica o tots els termes procedents d’una mateixa font, per dir-ne dos exemples només.

Però l’elaboració de diccionaris va més enllà de la simple redacció dels articles terminològics. El mateix mossèn Alcover va fer una lletra de convit a tots els amics de la llengua catalana que li va servir, amb molta paciència i dedicació, per reunir un gran volum de col·laboradors: pensem que l’elaboració del diccionari es va allargar més de 30 anys, molt més enllà de la seva mort. No és gens estrany, tenint en compte que volia recollir tant els mots de la llengua oral com de l’escrita, tant literària com col·loquial, de totes les èpoques i de tots els punts del domini lingüístic català. Imagineu-vos, però, haver pogut fer tota aquesta feina avui dia, amb la immediatesa i l’abast de les xarxes socials.

La interconnexió entre usuaris i l’edició en línia permeten també una actualització constant i gairebé instantània dels diccionaris, afegint-hi nous termes, esmenant errors. Abans les reedicions d’obres eren molt costoses, o bé directament inviables. També el ressò dels diccionaris ha assolit unes xifres que haurien estat impensables amb els tiratges de les obres en paper. Alguns diccionaris especialitzats del TERMCAT reben trenta mil, cinquanta mil o fins i tot cent mil visites a l’any. En canvi, pocs diccionaris en paper tenien tiratges superiors als cinc mil exemplars.

I encara hi podríem afegir molts altres avenços: els correctors automàtics, que detecten les badades de picatge com mai ho podran fer els ulls humans, els algoritmes d’ordenació dels termes, infal·libles, o en els diccionaris amb voluntat normalitzadora, com els del TERMCAT, eines que aviat permetran fer un seguiment exhaustiu a internet de com evoluciona l’ús dels nous termes proposats.

De tota manera, el tomb definitiu sembla que ens el donaran els darrers desenvolupaments d’intel·ligència artificial, com el famós ChatGPT: a aquest assistent virtual li pots demanar que et faci un diccionari de qualsevol àmbit d’especialitat en la llengua —o llengües— que vulguis. Proveu-ho. Els resultats són molt millorables encara: les definicions no són uniformes, la selecció de termes és parcial... I això sense entrar a fons en la veracitat de les informacions o en els biaixos conceptuals que, intencionadament o no, s’hi puguin introduir. De tota manera, això només acaba de començar i seria molt agosarat pensar que amb el temps aquests robots no puguin emular amb èxit l’art del terminògraf, tal com ja estan començant a fer en altres sectors, com el de la redacció d’articles periodístics o universitaris. Precisament fa uns dies, en aquest mateix diari, Genís Roca incloïa, entre les 10 bajanades que sorprenentment s’acostumen a dir, la frase Hi ha coses que la tecnologia no podrà fer mai. Com deia ell, No diguis mai mai. Temps al temps.

Avui et destaquem
El més llegit