Korpuse liidese eesmärgiks on võimaldada teha lihtsaid, eesti keele sõnamuutust arvestavaid päringuid TÜ korpuste tekstidest.
TÜ koondkorpuse alla kuuluva Teadusartiklite alamkorpuse kirjeldus ning käesoleva päringu aluseks olevad allalaaditavad tekstid asuvad siin.
Lähtetekstid on morfoloogiliselt analüüsitud ja automaatselt ühestatud OÜ Filosoft poolt.
Hinnanguliselt 3% analüüsidest on antud kontekstis valed, s.t. sõna algvorm, sõnaliik või grammatiline kategooria on määratud valesti.
Analüüsiga seotud probleeme on kirjeldatud artiklites:
Heiki-Jaan Kaalep, Tarmo Vaino Teksti täielik morfoloogiline analüüs lingvisti töövahendite komplektis kogumikus "Arvutuslingvistikalt inimesele" Tartu 2000 lk 87 - 99
Veskis, K.; Liba, E. Automatic Tagger Evaluation. Syntax assignment, NGSLT (Nordic graduate school on language technology) NLP (natural language processing) course 2008