Xusainova Zilola Yuldashevnaning
falsafa doktori (PhD) dissertatsiyasi himoyasi haqida e’lon

I. Umumiy ma’lumotlar.
Dissertatsiya mavzusi, ixtisoslik shifri (ilmiy daraja beriladigan fan tarmog‘i nomi): “O‘zbek tili birliklarini tokenlash, stemlash, lemmalashning lingvistik asoslari  va dasturiy ta’minoti”, 10.00.11 – Til nazariyasi. Amaliy va kompyuter lingvistikasi (filologiya fanlari).
Dissertatsiya mavzusi ro‘yxatga olingan raqam: B2023.2.PhD/Fil3688.
Ilmiy rahbar: Elov Botir Boltaevich, texnika fanlari bo‘yicha falsafa doktori (PhD), dotsent.
Dissertatsiya bajarilgan muassasa nomi: Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti.
IK faoliyat ko‘rsatayotgan muassasa nomi, IK raqami: Toshkent davlat o‘zbek tili va adabiyoti universiteti, DSc.03/30.12.2019.Fil.19.01(bir martalik ilmiy kengash).
Rasmiy opponentlar: Xolmonova Zulhumor Turdievna, filologiya fanlari doktori, professor; Abdurahmonova Nilufar Zaynobiddin qizi, filologiya fanlari doktori, professor.
Yetakchi tashkilot: Samarqand davlat universiteti.
Dissertatsiya yo‘nalishi: nazariy va amaliy ahamiyatga molik.
II.Tadqiqotning maqsadi o‘zbek tili leksik birliklarini tokenlash, stemlash va lemmalashning lingvistik asoslari va dasturiy ta’minotini ishlab chiqishdan iborat.
III. Tadqiqotning ilmiy yangiligi:
jahon va o‘zbek tilshunosligida leksik birliklarni tokenlash, stemlash va lemmalashning nazariy asoslari tizimlashtirilib, belgi va so‘zga asoslangan tokenlash, lingvistik qoidalar va korpus vostasidagi gibrid yondashuvli stemlash, lug‘atga asoslangan lemmalash usullari aniqlangan;
agglyutinativ tillar uchun stemlash jarayonidagi o‘zak va qo‘shimchaning bitta o‘zak bilan omonim bo‘lishi, so‘zning tovush o‘zgarishiga uchrashi, neologizm va NERlarni stemlash kabi muammolar aniqlanib, o‘zbek tilidagi turli tuzilishli leksik birliklarni stemlash va lemmalashning lingvistik asoslari ishlab chiqilgan;
o‘zbek tili milliy korpusi matnlarini qayta ishlash asosida qidiruv tizimini optimallashtirish usullari ishlab chiqilib, leksik birliklarni stemlash va lemmalash jarayoni ochib berilgan;
tokenlash jarayoni BPE algoritmi asosida amalga oshirilib, affikslarni ajratishga asoslangan stemlash, lugʻat va morfologik tahlilga tayanilgan lemmalash algoritmi ishlab chiqilib, o‘zbek tili matnlari uchun uzb.tokenizator, uzb.stemming va uzb.lemmatizator dasturiy ta’minoti yaratilgan.
IV. Tadqiqot natijalarining joriy qilinishi. O‘zbek tili birliklarini tokenlash, stemlash, lemmalashning lingvistik asoslari va dasturiy ta’minoti tadqiqi bo‘yicha olingan natijalar asosida:
o‘zbek tili birliklarini tokenlash, stemlash va lemmalashni amalga oshiruvchi dasturiy ta’minotdagi belgi va so‘zga asoslangan tokenlash, lingvistik qoidalar va korpus vositasidagi gibrid yondashuvli stemlash, lug‘atga asoslangan lemmalash haqidagi ilmiy xulosalardan Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti huzuridagi Davlat tilida ish yuritish asoslarini o‘qitish va malaka oshirish markazi davlat muassasasi markazida foydalanilgan (Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetining 2023-yil
12-oktyabrdagi 123-son dalolatnomasi). Natijada, o‘zbek tili birliklarini tokenlash, stemlash va lemmalash dasturiy ta’minotining sinovdan o‘tkazilishi natijasida o‘zbek tili gaplarining morfologik tahlilidagi 32000 dan ortiq sodda, 7500 dan ortiq qo‘shma leksemadan iborat ma’lumotlar bazasi shakllantirilgan;
o‘zbek tili birliklarini tokenlash, stemlash, lemmalash natijalaridan, xususan tabiiy tilga ishlov berishda o‘zbek, rus, ingliz tillarida stemlash va lemmalash sifatini oshirishga doir ilmiy natijalaridan Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetida 2021-2023-yillarda bajarilgan I-OT-2019-42 raqamli “O‘zbek adabiyotining ko‘p tilli (o‘zbek, rus, ingliz tillarida) elektron platformasini yaratish” mavzusidagi amaliy loyihada foydalanilgan (Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetining 2023-yil 19-oktyabrdagi 01/10-2182-raqamli ma’lumotnomasi). Natijada, tabiiy tilga ishlov berishda o‘zbek, rus, ingliz tillarida stemlash va lemmalash sifatini oshirish elektron platformada qidiruv sifatini yaxshilagan; o‘zbek tili birliklarini tokenlash, stemlash, lemmalash natijalaridan o‘zbek tiliga xos birliklar qidiruv natijasi samaradorligi ta’minlangan;
 o‘zbek tili birliklarini tokenlash, stemlash, lemmalashning natijasini asoslovchi algoritmlar va ular asosida yaratilgan dasturiy ta’minotidan Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetida 2021-2023-yillarda bajarilgan PZ-2020042022 “Turkiy tillarning lingvodidaktik elektron platformasini yaratish” mavzusidagi amaliy loyihada foydalanilgan (Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetining 2023-yil 19-oktyabrdagi 01/10-2183-raqamli ma’lumotnomasi). Natijada, stemlash va lemmalash algoritmi asosida turkiy tillarning lingvodidaktik elektron platformasi qidiruv tizimi ko‘rsatkichi oshishiga erishilgan.

Yangiliklarga obuna bo‘lish