Title |
How lemmatisation and derivational annotation affect productivity measures: The case of deverbal agent nouns in the Joint Corpus of Lithuanian / |
Translation of Title |
Kā lematizēšana un derivatīvā anotēšana ietekmē produktivitātes vērtēšanu: darītājvārdi Vienotajā lietuviešu valodas korpusā. |
Authors |
Pakerys, Jurgis ; Dadurkevičius, Virginijus ; Navickaitė-Klišauskienė, Agnė |
DOI |
10.22364/vnf.15 |
ISBN |
9789934363344 |
Full Text |
|
Is Part of |
Valoda: nozīme un forma = Language: meaning and form: Gramatika un vārddarināšana = Grammar and word formation.. Rīga : Latvijas Universitātes Akadēmiskais apgāds, 2024. t. 15, p. 138-151.. ISSN 2255-9256. eISSN 2256-0602. ISBN 9789934363344 |
Keywords [eng] |
word formation ; derivational productivity ; agent nouns ; Lithuanian |
Abstract [eng] |
Šajā rakstā aplūkoti Vienotā lietuviešu valodas tekstu korpusa (1,3 miljardi vārdu) automātiskās un manuālās lemmatizēšanas un marķēšanas posmi, pēc kuriem tiek vērtēta derivatīvā produktivitāte. Kā piemērs prezentēti dati par trim produktīviem lietuviešu valodas deverbālu lietvārdu piedēkļiem ‒ -toj-, -ėj-, -ik- ‒ un mērīta to realizētā, paplašināšanas un potenciālā produktivitāte. Autori cenšas parādīt, ka papildu pusautomātiskā lemmatizēšana un manuālā derivatīvā marķēšana ievērojami palielina gan lemmu, gan hapaksu skaitu. Tāpat atzīmēts, ka lemmatizēšanas procesu ietekmē mākslīgi palielināts lemmu skaits, kas rodas tādēļ, ka lemmatizators neatpazīst homogrāfiskas formas. Pēc manuālās hapaksu pārbaudes visbūtiskāk ir samazinājies sieviešu dzimtes lemmu ar -toj-a un -ėj-a skaits. |
Published |
Rīga : Latvijas Universitātes Akadēmiskais apgāds, 2024 |
Type |
Journal article |
Language |
English |
Publication date |
2024 |
CC license |
|