Slovenska skladnja v oblikoskladenjsko in skladenjsko označenih korpusih slovenščine
Description:... V monografiji so predstavljeni postopki oblikovanja jezikovnospecifičnih specifikacij za oblikoskladenjsko in površinskoskladenjsko označevanje korpusov slovenščine, kot so bile zasnovane v okviru projektov Jezikoslovno označevanje slovenskega jezika in nadgrajene v okviru projekta Sporazumevanje v slovenskem jeziku, skupaj s problemskim pregledom dilem, ki so pri oblikovanju specifikacij nastale, ter sprejetih uporabnostnih rešitev. Glede na rezultate predhodne ročne oz. polavtomatske identifikacije in analize vzorcev slovnično-pomenskega povezovanja glagolskih lem, kot se kažejo v tako označenih besedilnih korpusih, je opozorjeno na možnosti avtomatskega luščenja jezikovnih elementov, ki se tipično pojavljajo v specifičnih skladenjskih strukturah, iz oblikoskladenjsko in skladenjsko označenih korpusov, in sicer z vidika uporabe podatkov pri razvoju jezikovnih tehnologij in nadgradnji jezikovnih virov, hkrati pa kot osnova pri oblikovanju (korpusno)jezikoslovnih opisov zlasti za uporabnostne namene.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
The monograph presents the design processes of specifications for morphosyntactic and surface syntactic annotation of corpora of Slovene, as they were designed in the context of Linguistic Annotation of Slovene project and upgraded under the Communication in Slovene project. It provides a detailed account of the dilemmas that have arisen during the design and presents the adopted solutions. The book also presents a study of co-occurrence relations between selected verbal lemmas and typical constructions in their local contexts as evidenced by corpus data and discusses the possibility of semi-automatically extracting lemmas that occur in specific lexico-grammatical constructions from large morphosyntactically and syntactically annotated corpora of Slovene based on (a list of) pre-identified lexico-grammatical constructions. Such information can be used not only in the development of human language technologies, but also to upgrade existing Slovene language resources.
Show description