Abduraxmonova Nilufar Zaynobiddin qizining
fan doktori (DSc) dissertatsiyasi himoyasi haqida e’lon
I. Umumiy ma’lumotlar.
Dissertatsiya mavzusi, ixtisoslik shifri (ilmiy daraja beriladigan fan tarmog‘i nomi): “O‘zbek tili elektron korpusining kompyuter modellari”, 10.00.11 – Til nazariyasi. Amaliy va kompyuter lingvistikasi (filologiya fanlari).
Dissertatsiya mavzusi ro‘yxatga olingan raqam: B2019.2.DSc/Fil1174.
Ilmiy maslahatchi: Dadaboev Hamidulla Aripovich, filologiya fanlari doktori, professor.
Dissertatsiya bajarilgan muassasa nomi: Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
IK faoliyat ko‘rsatayotgan muassasa nomi, IK raqami: O‘zbek tili, adabiyoti va fol`klori instituti, DSc.02/30.12.2019.Fil.46.03.
Rasmiy opponentlar: Muhamedova Saodat Xodayberdievna, filologiya fanlari doktori, professor; Urinbaeva Dilbar Bazarovna, filologiya fanlari doktori, dotsent; Nazirova Elmira Shodmanovna, texnika fanlari doktori, desent.
Yetakchi tashkilot: Farg‘ona davlat universiteti.
Dissertatsiya yo‘nalishi: nazariy va amaliy ahamiyatga molik.
II. Tadqiqotning maqsadi o‘zbek tili elektron korpusini yaratishning konseptologik modellarini yaratish hamda lingvistik annotatsiyalangan til korpusi uchun kompyuter texnologiyalari metodlaridan foydalanishning samarali usullarini ishlab chiqishdan iborat.
III. Tadqiqotning ilmiy yangiligi:
o‘zbek tili uchun ilk bor FST (finite state trunsducer) chekli avtomat transyuteri vositasida korpusni morfologik teglashning avtomatik usuli yordamida o‘zbek tili korpusi uchun lemmatizatsiya va tokenizatsiya jarayonlarining lingvistik tahlil bosqichlari ishlab chiqilgan hamda morfologik ma’lumotlar bazasi, morfotaktik qoidalar tizimi shakllantirilgan;
korpusni sintaktik teglash va annotatsiyalashda universal tobelik nazariyasining UdPipe metodi orqali ConLLU format namunasida o‘zbek tilining sintaktik modellari aniqlangan;
o‘zbek tili korpus menejeri (qidiruv tizimi)ning lemma, token bo‘yicha hamda n-gram modelli konkordans qidiruv tizimi ishlab chiqilgan;
tarjima qilish algoritmi va o‘zbek tili parallel korpusining tarjima xotirasini yaratishda WordFast texnologiyasi foydalanilgan hamda o‘zbek tilining ingliz va rus tillarida tarjima birliklari muqobillarining ma’lumotlar bazasi tuzilgan;
korpusda qidirilayotgan so‘zning imloviy xatolarini aniqlash va unga yaqin bo‘lgan so‘zlar koeffisientini belgilash hamda natijani qidiruv interfeysida ilova qilishda Djaro Vinkler algoritmini qo‘llashning maqsadga muvofiq ekanligi asoslangan.
IV. Tadqiqot natijalarining joriy qilinishi. O‘zbek tili elektron korpusining kompyuter modellari bo‘yicha olingan ilmiy va amaliy natijalar sifatida lingvistik annotatsiyalash tamoyillari, lisoniy modellari, avtomatik usullari (FST texnologiyasi va UdPipe usuli), korpus menejeri, qidiruv tizimi uchun tahrirlovchi dastur kabi tadqiqot xulosalaridan:
korpus menejeri (qidiruv tizimi)ning lemma, token hamda n-gram modeli asosida konkordanslarning qidiruv tizimi orqali korpusda jamlangan ilmiy uslubdagi materiallar OT-F1-029 raqamli “O‘zbek davlatchiligi tarixida sug‘diy til va yozuvining tutgan o‘rni (mil.av. II – milodiy XII asrlar)” (2017-2020) mavzusidagi fundamental grant loyihasini bajarishda maqolalar va monografiyalarni tayyorlashda ilmiy elektron manba sifatida hamda platformada yaratilgan parallel korpuslar va tarjima lug‘atlardan loyihaning amaliy natijalarini xorijiy jurnallarda chop etishda foydalanilgan (Toshkent davlat o‘zbek tili va adabiyoti universitetining 2021 yil 23 sentyabrdagi 01/4-1713-son ma’lumotnomasi). Natijada loyiha bo‘yicha olib tadqiqotlarning mazmuniy kontenti boyigan, ilmiy darajasi oshgan;
2017-2019 yillarda amalga oshirilgan OT-F1-78 “Hozirgi globallashuv davrida o‘zbek tili, uning tarixiy taraqqiyoti va istiqbollari (vazifaviy uslublar tahlili asosida)”nomli fundamental loyihasida o‘zbek tili lotin yozuvidagi ko‘p jildli “O‘zbek tilining izohli lug‘ati”ni tayyorlashda dissertatsiya natijasi sifatida yaratilgan o‘zbek tilining elektron korpus menejeri (qidiruv tizimi)ning lemma, token, konkordans hamda so‘z birikmasi bo‘yicha qidirish kabi funksional imkoniyatlaridan foydalanilgan (O‘zbekiston Respublikasi Fanlar akademiyasining 2021 yil 16 sentyabrdagi 3/1255-2651-son ma’lumotnomasi). Natijada loyiha bo‘yicha olib borilgan tadqiqotlarning mazmuniy kontenti kengaygan, maqolalarning turli kontekstda semantik maydonlarda voqelanishi korpus asosida aniqlangan.
o‘zbek tili korpus menejerining lemma, token hamda n-gram modeli asosida konkordanslarning qidiruv tizimiga doir amaliy natijalaridan “Mahalla va oila” ilmiy tadqiqot institutining JHBL-18 raqamli “Turli avlod vakillarining oilaviy qadriyatlarini tadqiq etish” (2020-2021) loyihasida foydalanilgan (“Mahalla va oila” ilmiy tadqiqot institutining 2021 yil 25 iyundagi 13-son ma’lumotnomasi). Natijada tadqiqotchilar uchun tilda aks etgan qadriyatlarning gender, yosh, va jinsga doir, qolaversa, milliy xususiyatlarini o‘rganish va ilmiy jihatdan statistikasini aniqlashda asos vazifasini bajargan;
o‘zbek tili elektron korpusini yaratishning amaliy natijalaridan JHBL-18 raqamli “O‘zbekistonda “Baxtiyor oila” web portalini yaratish” (2020-2021) loyihasida, shuningdek elektron korpusdan turli janrga oid oila mavzusidagi matnlarning xronologiyasi va ilmiy tavsifini tahlil qilish milliy qadriyatlar va ijtimoiy munosabatlarni o‘rganishda foydalanilgan (“Mahalla va oila” ilmiy tadqiqot institutining 2021 yil 25 iyundagi 12-son ma’lumotnomasi). Natijada loyiha mavzusiga doir tushunchalar yangi ilmiy dalillar bilan boyitilgan;
o‘zbek tili korpus menejerining lemma, token bo‘yicha hamda n-gram modelli konkordans qidiruv tizimidan I-OT-2019-42 raqamli “O‘zbek va ingliz tillarining elektron (Inson qiyofasi, fe’l atvori, tabiat va milliy timsollar tasviri) poetik lug‘atini yaratish” (2019-2021) mavzusidagi amaliy grant loyihasida elektron lug‘at kontentini materiallari bilan boyitishda foydalanilgan (Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetining 2021 yil 18 sentyabrdagi 01/4-1638-son ma’lumotnomasi). Natijada o‘zbek tili elektron korpusining ichki korpus – parallel korpus tarjima xotirasi va tarjima segment birliklaridan foydalanib, lug‘atda aks etgan o‘zbek va ingliz tillarida inson qiyofasi, fe’l-atvori, tabiat va milliy timsollarni ifodalovchi leksik birliklarni to‘plash va ularning ingliz va o‘zbek tillaridagi muqobillarini aniqlashga erishilgan;
o‘zbek tili korpusi uchun lemmatizatsiya va tokenizatsiya jarayonlarining lingvistik tahlil bosqichlari ishlab chiqilgan hamda morfologik ma’lumotlar bazasi, morfotaktik qoidalar tizimi hamda o‘zbek tili uchun ilk bor FST (finite state transducer – chekli avtomat transyuteri vositasida korpusni morfologik teglashning avtomatik usuli, korpusni sintaktik teglash va annotatsiyalashda UdPipe metodi orqali o‘zbek tilining sintaktik modellari bazasi asosida o‘zbek tili uchun universal tobelik nazariyasining ConLLU modeli 5111200 – O‘zbek tili va adabiyoti, 5120100 – Filologiya va tillarni o‘qitish (o‘zbek tili), 5120900 – O‘zbek-ingliz tarjima nazariyasi va amaliyoti yo‘nalishlari bakalavr talabalari, magistrlar, doktorantlar, tadqiqotchilar va soha mutaxassislari, shuningdek, malaka oshirish va pedagogik kadrlarni qayta tayyorlash kursi tinglovchilariga mo‘ljallangan “Kompyuter lingvistikasi” darsligida o‘z ifodasini topgan (Oliy va o‘rta maxsus ta’lim vazirligining 2019 yil 20 iyuldagi 654-son buyrug‘i). Natijada darslikning g‘oyaviy asoslari nazariy va amaliy jihatdan asoslangan hamda ma’lumotlar bilan boyitilgan.
yaratilgan http://uzbekcorpus.uz sayti web resurs sifatida Qozon Federal universitetining Hisoblash matematikasi va axborot texnologiyalari institutida kompyuter lingvistikasi faniga doir korpus lingvistikasi hamda morfologik analizator kabi mavzularni o‘qitishda foydalanilmoqda (Qozon federal universiteti Hisoblash matematikasi va Axborot texnologiyalari institutining ma’lumotnomasi). Natijada o‘zbek tilining elektron korpusi http://www.turklang.net saytidagi turkiy til korpuslar ro‘yxatida ilova qilinib, turkiy tillarning struktur-funksional xususiyatlarini qiyoslash hamda lingvistik resurs sifatida tabiiy til texnologiyalardan foydalanish imkoniyati yaratilgan.