Català | English |Español | Galego

Frogatuta dago hainbat teknikaren konbinazioa oso bide emankorra dela Informazioaren Erauzketa (IE) xede duten teknologietan. Erabili ohi diren tekniken artean aipagarrienetakoak dira, teknika estatistikoekin eta ikasketa automatikoko teknikekin batera , estrategia linguistikoetan oinarritutakoak. Hizkuntza Naturalaren Prozesamendua(k) (HNP) (lematizazioa, etiketatze morfologikoa, analisi sintaktikoa, desanbiguazioa delako sekuentziaren bitartez) emaitza onak eman ditzake aldez aurretik mugaturiko datu-multzoei (testuak, dokumentuen datu-baseak, testu- corpus ak, ezagutza-bankuak) ezartzen zaizkienean. Adibidez, HNPak emaitza onak ematen ditu dokumentuen laburpenen sorrerarako, hiztegi konputazionalen aberaste automatikorako edo terminologiaren erauzketa automatikorako. Aitzitik, IErako teknikak mugatu gabeko iturriei ezartzen zaizkienean, adibidez Webei ezartzen zaizkienean, ezinezkoa dirudi prozesamendu linguistiko estentsiboak eta, ondorioz, ezinbestekoak dira bestelako teknika linguistikoak, esate baterako, kontzeptuen ontologiak, indexazio- thesaurus ak, hierarkia lexikoak eta konkordantzia-zerrendak. Teknika horiek, teknika matematikekin konbinatuta , bilaketa-tresnen eraginkortasuna handitzea ahalbidetzen digute.

Ikerketa-egitasmo honen xedea da gaztelaniaz, katalanez, galegoz eta euskaraz idatzitako ekonomia arloko diskurtsoaren eta terminologiaren deskripzio eraginkorrak egitea. Xede horrekin lotuta, helburu aplikatu bat dago: IEr ako hainbat teknikek eta, bereziki, Interneteko bilaketa-tresnek balia litzaketen hizkuntza anitzeko baliabide linguistikoak sortzea. Ikerketa-taldeak badu, dagoeneko, linguistikoki prozesatutako testu- corpus bat hiru hizkuntzatarako (gaztelania, katalana eta ingelesa) eta egitasmo honetan aurreikusten du testu- corpus osagarriak eraikitzea euskararako eta galegorako. Corpus horien ustiapenak posible egingo du IErako orokortu litezkeen estrategiak diseinatzea. Areago, corpus hauen ustiapena baliatu ahal izango da IEan oinarritzen diren beste aplikazio batzuk garatzeko, bereziki, aplikazio semantiko eta fraseologikoak garatzeko: prozesamendu-hiztegiak informazio semantiko eta fraseologikoarekin aberastea, datu-base terminologiko eleanitz batekin uztartutako ontologia baten garapena ekonomiaren arlorako, edota terminologia-erauzle automatikoa moldatzea ekonomiaren arlorako. Informazio-erauzketarako ere erabili ahal izango diren baliabide horiez gain, egitasmo honetan IErako emaitzen artean ikusmiran dugu diseinatzea kontsulta eleanitzak berreraikitzeko sistema bat, bilaketa-tresnetarako input modura erabili ahal izango dena. Kontsultak berreraikitzeko sistema honek ontologiaren eta datu-base terminologikoaren datuak erabiliko ditu kontsulta bakun eta anbiguoak, kontsulta konplexuetan eraldatzeko. Bihurketa horren xedea da erantzunen doitasuna hobetzea ekonomiaren alorraren barruan.

 

Eguneratze-data: 26-06-2007