El RST Spanish Treebank és un corpus de textos especialitzats en espanyol anotat amb les relacions discursives de la Rhetorical Structure Theory (RST) de Mann i Thompson (1988). Qualsevol usuari pot consultar i/o descarregar aquest corpus i emprar les eines de cerca de manera gratuïta.
El projecte està dirigit per Iria da Cunha, membre de l'IULA, i suposa la col·laboració internacional entre tres institucions: l'Institut Universitari de Lingüística Aplicada de la Universitat Pompeu Fabra, el Instituto de Ingeniería de la Universidad Nacional Autonónoma de México i el Laboratoire Informatique d'Avignon de la Université d'Avignon et des Pays de Vaucluse.
La presentació oficial del RST Spanish Treebank es va dur a terme el passat mes de juny a Portland (EEUU) en el 5th Linguistic Annotation Workshop, en el marc de la 49a edició de l'ACL Conference. L'article presentat es pot consultar de manera oberta: (2011) da Cunha, Iria; Torres-Moreno, Juan-Manuel; Sierra, Gerardo "On the development of the RST Spanish" dins Proceedings of the Fifth Law Workshop (LAW V), Portland, Oregon, 23-24 June 2011, 1–10, Association for Computational Linguistics, https://aclweb.org/anthology-new/W/W11/W11-0401.pdf
Aquest corpus servirà per al desenvolupament de nombrosos estudis i aplicacions relacionats amb el discurs en espanyol.
© INSTITUT DE LINGÜÍSTICA APLICADA - UNIVERSITAT POMPEU FABRA