Institut de Lingüística Aplicada
 

Actualitat / Actualidad / News   

[20/09/11] L'IULA participa en el desenvolupament del RST Spanish Treebank, el primer corpus en espanyol anotat amb relacions discursives

El RST Spanish Treebank és un corpus de textos especialitzats en espanyol anotat amb les relacions discursives de la Rhetorical Structure Theory (RST) de Mann i Thompson (1988). Qualsevol usuari pot consultar i/o descarregar aquest corpus i emprar les eines de cerca de manera gratuïta.

El projecte està dirigit per Iria da Cunha, membre de l'IULA, i suposa la col·laboració internacional entre tres institucions: l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra, el Instituto de Ingeniería de la Universidad Nacional Autonónoma de México i el Laboratoire Informatique d'Avignon de la Université d'Avignon et des Pays de Vaucluse.

La presentació oficial del RST Spanish Treebank es va dur a terme el passat mes de juny a Portland (EEUU) en el 5th Linguistic Annotation Workshop, en el marc de la 49a edició de l'ACL Conference. L'article presentat es pot consultar de manera oberta: (2011) da Cunha, Iria; Torres-Moreno, Juan-Manuel; Sierra, Gerardo "On the development of the RST Spanish" dins Proceedings of the Fifth Law Workshop (LAW V), Portland, Oregon, 23-24 June 2011, 1–10, Association for Computational Linguistics, https://aclweb.org/anthology-new/W/W11/W11-0401.pdf

Aquest corpus servirà per al desenvolupament de nombrosos estudis i aplicacions relacionats amb el discurs en espanyol.

© INSTITUT DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA