-
Para conocer las características de los textos de economía hemos utilizado dos corpus: uno bilingüe y otro monolingüe.
El bilingüe se compone de dos textos: uno de economía general, y otro de marketing. Hemos considerado estos dos corpus como especializados.
Hay que tener en cuenta que los dos textos son traducciones (el texto original está en español).
El texto de economía tiene 177.799 palabras:
GARCÍA DELGADO, J.L. [zuz.] [et al.]. Lecciones de economía española. Madrid: Civitas, 1995.
GARCÍA DELGADO, J.L. [zuz.] UZEI [trad.]. Espainiako ekonomiari buruzko ikasgaiak. Bilbo: EHU/UPV Argitalpen Zerbitzua, 1998.
El texto de marketing tiene 133.476 palabras:
AGUIRRE GARCÍA, M.S. [coord]. Marketing en sectores específicos. Madrid: Pirámide, 2000
AGUIRRE GARCÍA, M.S. [coord]. Sektore espezifikoetako marketina. UZEI [trad.] (2003)
Estos dos textos están alineados a nivel oracional. Los puntos y los dos puntos son los que marcan estas oraciones.
El corpus monolingüe ha sido extraído del periódico Euskaldunon Egunkaria . Hemos tomado todos los artículos relacionados con la economía durante el año 2000. En total son 600.931 palabras.
Hemos lematizado y analizado morfológicamente los corpus. Para el análisis de los textos en euskera hemos utilizado el analizador EUSTAGGER (Aduriz et al ., 1994) desarrollado en el grupo IXA de la Universidad del País Vasco (UPV/EHU) .
Para la parte en castellano hemos utilizado el analizador Freeling (Atserias et al. , 2006) desarrollado por el grupo TALP de la Universitat Politècnica de Catalunya (UPC).
Uno de los objetivos de este proyecto era extraer la terminología propia del ámbito de la economía. Para ello hemos utilizado dos extractores de terminología: ERAUZTERM para los textos monolingües, y ELEXBI para los textos bilingües.