Päring
Päringuid on võimalik sisestada nii menüüde kaudu kui ka otse päringuaknasse.
Ka menüüde kaudu päringu esitamisel konstrueeritakse päringustring, mille formaat on kujul:
[-|+|$|&][sõna|syn.kategooria|sem.kategooria][(täpsustus[=väärtus]*)][@word|syn|sem]
Ehk siis inimkeeles:
- - sõna alguses märgib eitust, ehk et järgnevat ei tohi lauses olla
- + märgib, et sõna peab vahetult järgnema eelmisele sõnale. Kui eelnev sõna on
eitusega, siis eitus laieneb ka sellele sõnale.
- $ märgib, et sõna peab olema eelneva sõnaga samas alamlauses. Kui eelnev sõna on
eitusega, siis eitus laieneb ka sellele sõnale.
- & lisab eelnevale sõnale täiendava kriteeriumi.
- sõna või süntaktiline- või semantiline kategooria.
Päring võib sisaldada metamärke ? (üks suvaline märk) ja * (suvaline hulk suvalisi märke). Nimetatud märkide leidmiseks väärtustes tuleb kasutada langjoont \ .
- Sõnaliigi või vormi täpsustamiseks tuleb vastav täpsustus lisada sõna järele sulgudesse. Korraga võib esitada mitu täpsustust need tühikutega eraldades.
- Süntaktilise või semantilise kategooria täpsustamiseks tuleb need sisestada sõna järele sulgudesse kujul täpsustus=väärtus.
Erinevatel semantilistel kategooriatel on erinevad täpsustused, neid on mugav valida "Täpsemast otsingust".
Väärtus võib sisaldada metamärke.
Kui väärtus sisaldab tühikut, tuleb see piirata jutumärkidega.
Sõna järel sulgudes võib olla üks või mitu täpsustust, mitme täpsustuse puhul tuleb need eraldada tühikuga
- Täpsustusi saab lisada ka välistavalt. Selle jaoks tuleb täpsustuse ette panna -
- @... päringu lõpus tähistab, kust sõna otsida - word (sõna), syn (süntaks), sem (semantika).
Vaiklimisi otsitakse lemmat.
- päringustringi metamärkide otsimiseks korpusest tuleb kasutada langjoont \ , ehk
\, \- \@ \( \) jne.
Näited:
- tema - leiab laused, kus esineb sõna "tema"
- tema ja isa - leiab laused kus esinevad sõnad "tema", "ja", "isa"
- tema@word +ja@word +isa@word = leiab laused, kus esineb fraas "tema ja isa"
- tema $isa = leiab laused, kus sõnad "tema" ja "isa" esinevad samas alamlauses
- saadik(s) – otsitakse nimisõna "saadik" suvalisi vorme
- (pl com) - otsitakse vormi mitmuse kaasaütlev
- *uvisid*(pl par)@word – alamsõnet "uvisid", kusjuures sõna oleks mitmuse osastav
- ema(sg -nom -gen) - leia kõik "ema" ainuse vormid, mis ei ole nimetavas ega omastavas käändes
- tegema +ära@word – otsitakse lauseid, kus on "tegema" suvalises vormis ja talle
järgneb "ära"
- bond -james – otsitakse sõna "bond" vorme, kusjuures sõna "james" ei tohi samas lauses esineda
- date@sem – otsitakse semantilist kategooriat "date"
- la*la(s sg gen)@word &org@sem - leiab kõik ainsuse omastavas nimisõnad, mis algavad ja lõpevad "la"-ga ja on organisatsioonid
NB! Menüüde abil koostatav "Täpsem otsing" ei võimalda oma kastides
päringustringi väljendite kasutamist. Päringustringi saab kasutada ainult
tavalises otsingukastis.
Vastuseks väljastatakse maksimaalselt 200 lauset korraga.
Kui päringule vastavaid lauseid on rohkem kui 200, siis väljastamiseks tehakse
sobivate hulgast valik juhuslikult, kusjuures kahel järjestikusel päringul ei
pruugi see valik olla samasugune.
Kõikide lausete vaatamiseks märkige "Näita kõiki lauseid".
Valikut arvestatakse kõikide tulevaste päringute sooritamisel.
Märgenduse vaatamiseks tuleb soovitud sõnal klõpsata. Liikudes hiirega süntaktilisele või semantilisele märgendusele, tuuakse esile kogu väljend.
Täpsema otsingu liides oskab hetkel sõnale määrata vaid ühe semantilise täpsustuse. Täiendavate täpsustuste määramiseks
kasutage "sama sõna on" lisakirjet.
Keelekorpuste kasutajad on pannud tähele, et korpustes päringuid tehes võib vastuseks saada korduvaid lauseid,
lõike või isegi suuremaid juppe artiklitest. Tegemist ei ole aga korpuste koostamisel tekkinud vigadega,
vaid korduvad üksused on esinenud juba allikmaterjalide (peamiselt ajalehtede) erinevates, tavaliselt küll sisult
sarnastes artiklites.
Grammatilised kategooriad
Verbikategooriate kohta võib lisa lugeda Keele ja Kirjanduse artiklist
Lisaks võib huvi pakkuda märgendus- või kategooriasüsteemide vastavustabel