Subprojecte de la UPF
Objectius propis
- La compleció de l'adaptació de YATE a dret en català. Ampliació d'EWN. Avaluació de resultats.
- Les noves adaptacions de YATE per al català en informàtica i medi ambient. Ampliació d'EWN. Avaluació de resultats.
- Les noves adaptacions per al castellà en dret, informàtica i medi ambient. Ampliació d'EWN. Avaluació de resultats.
- Anàlisi contrastiva de les etiquetes de processament usades per a català-castellà i per a l'euskera (tasca compartida).
- Establiment de protocols per a l'intercanvi de formats, a partir de l'anàlisi contrastiu dels etiquetaris usats.
- Llistat d'expressions per a la detecció de relacions conceptuals en català.
- Disseny i implementació d'una nova plataforma d'accés a l'eina YATE, amb aplicatius complementaris diversos sobre detecció de relacions conceptuals.
Paquets de treball
- Ampliació d'EWN en dret en castellà i en català (parcial). Fronteres de domini de dret. Avaluació de resultats de YATE en dret/castellà i en dret/català.
- Ampliació d'EWN en medi ambient en castellà i en català. Fronteres de domini de medi ambient. Avaluació de resultats de YATE en medi ambient /castellà i en medi ambient /català.
- Ampliació d'EWN en informàtica en castellà i en català. Fronteres de domini d'informàtica. Avaluació de resultats de YATE en informàtica /castellà i en informàtica /català.
- Anàlisi contrastiva de les etiquetes de processament usades per a català-castellà i per a l'euskera. Establiment de protocols per a l'intercanvi de formats.
- Compleció del llistat d'expressions per a la detecció de relacions conceptuals en català.
- Disseny d'una nova plataforma d'accés a l'eina YATE. Implementació de la plataforma. Incorporació de l'aplicatiu sobre detecció de relacions conceptuals. Documentació tècnica i d'usuari.
Subprojecte de l'EHU
Objectius propis
- La compleció de recursos textuals de temàtica especialitzada per al basc : corpus textuals de referència en medicina, dret, informàtica i medi ambient, mitjançant convenis de col·laboració amb institucions i empreses.
- Processament lingüístic d'una mostra significativa d'aquests corpus (lematització, anàlisi morfològica i desambiguació).
- Anàlisi contrastiva de les etiquetes de processament usades per a català-castellà i per a l'euskera (tasca compartida).
- L'establiment d'equivalents bascos per als synsets incorporats en castellà i català a EWN (diccionari multilingüe).
- L'enriquiment d'EWN amb dades del basc sobre àmbits d'economia, medicina, dret, informàtica i medi ambient (a partir del diccionari anterior).
- L'establiment d'equivalents en euskera i en castellà a partir del llistat d'expressions de relacions conceptuals en català.
- Disseny i desenvolupament de la pàgina web del projecte. Portal de recursos i eines utilitzats en el projecte.
Paquets de treball
- La compleció de recursos textuals de temàtica especialitzada per al basc: corpus textuals de referència en medicina, dret, informàtica i medi ambient, mitjançant convenis de col·laboració amb institucions i empreses.
- Processament lingüístic d'una mostra significativa d'aquests corpus (lematització, anàlisi morfològica i desambiguació). Revisió de resultats (Gold Standard).
- Anàlisi contrastiva de les etiquetes de processament usades per a català-castellà i per a l'euskera. Establiment de protocols per a l'intercanvi de formats.
- L'establiment d'equivalents bascos per als synsets incorporats en castellà i català en EWN (diccionari multilingüe sobre àmbits d'economia, medicina, dret, informàtica i medi ambient). Introducció de dades a EWN.
- L'establiment d'equivalents en euskera i en castellà a partir del llistat d'expressions de relacions conceptuals en català.
- Disseny i desenvolupament de la pàgina web del projecte. Portal de recursos i eines utilizats en el projecte. Publicació a la web dels resultats del projecte.
Data d'actualització:
12-12-2007