Actualització del Corpus Textual Informatitzat de la Llengua Catalana de l’IEC

S’ha instal·lat al web de l’Institut d’Estudis Catalans (IEC) una nova aplicació de consulta del Corpus Textual Informatitzat de la Llengua Catalana (CTILC), que permet obtenir informació a partir de textos en català publicats entre el 1832 i el 2008.

En la seva configuració inicial, el CTILC contenia cinquanta-dos milions de mots i cobria el període cronològic comprès entre el 1832 i el 1988. L’any 2015, l’IEC va emprendre el projecte d’actualització del CTILC i, des d’aleshores, s’ha completat amb textos publicats fins al 2008 (uns vint milions de mots més), de manera que el corpus consultable actualment té un volum total de setanta-dos milions de mots.

D’altra banda, es preveu que a finals del 2021 s’hagi actualitzat el corpus amb textos publicats fins al 2018. A partir d’aquest moment, s’espera portar a terme un pla de treball que permeti l’actualització permanent del CTILC.

La nova aplicació de consulta del CTILC s’integra plenament en el portal de dades lingüístiques de la Secció Filològica, i ha substituït les dues plataformes anteriors (anomenades consulta bàsica i consulta avançada, respectivament). L’accés al CTILC es pot fer directament (a través de l’adreça web ctilc.iec.cat) o bé mitjançant consultes realitzades sobre els altres recursos del portal (DIECDDLCDCVBDiccionari de sinònimsCiTTERMCAT) clicant sobre el botó corresponent.

Els resultats que l’usuari pot obtenir de la consulta del CTILC es presenten bàsicament sota l’opció «Concordances», el patró de selecció de les quals pot ser de diferent naturalesa: lema, forma, lema (amb formes seleccionables), coocurrències (una seqüència encadenada de diferents elements lingüístics) i noms propis; també es pot obtenir informació quantitativa sobre les combinacions lèxiques que un determinat lema manté amb la resta de lemes del corpus (opció «Col·locacions»); finalment, l’opció «dades numèriques» dona informació quantitativa sobre el volum del corpus.

Publicació del ‘Glossari de termes gramaticals’

La Secció Filològica de l’Institut d’Estudis Catalans (IEC) ha obert al públic el Glossari de termes gramaticals, un recull terminològic en línia que conté set-cents articles corresponents a termes gramaticals dels camps de la fonètica, la morfologia i la sintaxi.

Per a elaborar-lo, s’ha partit del glossari de la Gramàtica essencial de la llengua catalana (GEIEC), que s’ha revisat i ampliat. Com el glossari de la GEIEC, obert al públic el gener del 2019, el Glossari de termes gramaticals es consulta en línia, però, a diferència d’aquell, no és un element auxiliar de la gramàtica sinó una obra lexicogràfica autònoma.

Presenta la novetat d’incloure —a més del lema, la definició i els exemples— informacions complementàries diverses: sinònims, termes relacionats conceptualment, termes amb què l’entrada manté relacions de complementarietat o contrast i equivalents en castellà. També s’han incrementat les informacions addicionals en forma de nota que segueix la definició. Els articles principals contenen, a més, una remissió a l’apartat de la GEIEC en què es defineix el concepte, cosa que permet ampliar la informació, de manera que es dona accés a una caracterització enciclopèdica de cadascuna de les entrades corresponents a lemes principals. D’aquesta manera, la remissió reconnecta el Glossari de termes gramaticals amb l’obra de què parteix: la GEIEC.

Aquest glossari en línia forma part del Portal CiT de l’Institut d’Estudis Catalans i es pot consultar aquí.