Sayt test rejimida ishlamoqda

Хусаинова Зилола Юлдашевнанинг
фалсафа доктори (PhD) диссертацияси ҳимояси ҳақида эълон

I. Умумий маълумотлар.
Диссертация мавзуси, ихтисослик шифри (илмий даража бериладиган фан тармоғи номи): “Ўзбек тили бирликларини токенлаш, стемлаш, леммалашнинг лингвистик асослари  ва дастурий таъминоти”, 10.00.11 – Тил назарияси. Амалий ва компютер лингвистикаси (филология фанлари).
Диссертация мавзуси рўйхатга олинган рақам: B2023.2.PhD/Fil3688.
Илмий раҳбар: Элов Ботир Болтаевич, техника фанлари бўйича фалсафа доктори (PhD), доцент.
Диссертация бажарилган муассаса номи: Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети.
ИК фаолият кўрсатаётган муассаса номи, ИК рақами: Тошкент давлат ўзбек тили ва адабиёти университети, DSc.03/30.12.2019.Fil.19.01(бир марталик илмий кенгаш).
Расмий оппонентлар: Холмонова Зулҳумор Турдиевна, филология фанлари доктори, профессор; Абдураҳмонова Нилуфар Зайнобиддин қизи, филология фанлари доктори, профессор.
Етакчи ташкилот: Самарқанд давлат университети.
Диссертация йўналиши: назарий ва амалий аҳамиятга молик.
II.Тадқиқотнинг мақсади ўзбек тили лексик бирликларини токенлаш, стемлаш ва леммалашнинг лингвистик асослари ва дастурий таъминотини ишлаб чиқишдан иборат.
III. Тадқиқотнинг илмий янгилиги:
жаҳон ва ўзбек тилшунослигида лексик бирликларни токенлаш, стемлаш ва леммалашнинг назарий асослари тизимлаштирилиб, белги ва сўзга асосланган токенлаш, лингвистик қоидалар ва корпус востасидаги гибрид ёндашувли стемлаш, луғатга асосланган леммалаш усуллари аниқланган;
агглютинатив тиллар учун стемлаш жараёнидаги ўзак ва қўшимчанинг битта ўзак билан омоним бўлиши, сўзнинг товуш ўзгаришига учраши, неологизм ва НЕРларни стемлаш каби муаммолар аниқланиб, ўзбек тилидаги турли тузилишли лексик бирликларни стемлаш ва леммалашнинг лингвистик асослари ишлаб чиқилган;
ўзбек тили миллий корпуси матнларини қайта ишлаш асосида қидирув тизимини оптималлаштириш усуллари ишлаб чиқилиб, лексик бирликларни стемлаш ва леммалаш жараёни очиб берилган;
токенлаш жараёни БПЕ алгоритми асосида амалга оширилиб, аффиксларни ажратишга асосланган стемлаш, лугʻат ва морфологик таҳлилга таянилган леммалаш алгоритми ишлаб чиқилиб, ўзбек тили матнлари учун узб.токенизатор, узб.стемминг ва узб.лемматизатор дастурий таъминоти яратилган.
IV. Тадқиқот натижаларининг жорий қилиниши. Ўзбек тили бирликларини токенлаш, стемлаш, леммалашнинг лингвистик асослари ва дастурий таъминоти тадқиқи бўйича олинган натижалар асосида:
ўзбек тили бирликларини токенлаш, стемлаш ва леммалашни амалга оширувчи дастурий таъминотдаги белги ва сўзга асосланган токенлаш, лингвистик қоидалар ва корпус воситасидаги гибрид ёндашувли стемлаш, луғатга асосланган леммалаш ҳақидаги илмий хулосалардан Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети ҳузуридаги Давлат тилида иш юритиш асосларини ўқитиш ва малака ошириш маркази давлат муассасаси марказида фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2023-йил
12-октябрдаги 123-сон далолатномаси). Натижада, ўзбек тили бирликларини токенлаш, стемлаш ва леммалаш дастурий таъминотининг синовдан ўтказилиши натижасида ўзбек тили гапларининг морфологик таҳлилидаги 32000 дан ортиқ содда, 7500 дан ортиқ қўшма лексемадан иборат маълумотлар базаси шакллантирилган;
ўзбек тили бирликларини токенлаш, стемлаш, леммалаш натижаларидан, хусусан табиий тилга ишлов беришда ўзбек, рус, инглиз тилларида стемлаш ва леммалаш сифатини оширишга доир илмий натижаларидан Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетида 2021-2023-йилларда бажарилган И-ОТ-2019-42 рақамли “Ўзбек адабиётининг кўп тилли (ўзбек, рус, инглиз тилларида) электрон платформасини яратиш” мавзусидаги амалий лойиҳада фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2023-йил 19-октябрдаги 01/10-2182-рақамли маълумотномаси). Натижада, табиий тилга ишлов беришда ўзбек, рус, инглиз тилларида стемлаш ва леммалаш сифатини ошириш электрон платформада қидирув сифатини яхшилаган; ўзбек тили бирликларини токенлаш, стемлаш, леммалаш натижаларидан ўзбек тилига хос бирликлар қидирув натижаси самарадорлиги таъминланган;
 ўзбек тили бирликларини токенлаш, стемлаш, леммалашнинг натижасини асословчи алгоритмлар ва улар асосида яратилган дастурий таъминотидан Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетида 2021-2023-йилларда бажарилган ПЗ-2020042022 “Туркий тилларнинг лингводидактик электрон платформасини яратиш” мавзусидаги амалий лойиҳада фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2023-йил 19-октябрдаги 01/10-2183-рақамли маълумотномаси). Натижада, стемлаш ва леммалаш алгоритми асосида туркий тилларнинг лингводидактик электрон платформаси қидирув тизими кўрсаткичи ошишига эришилган.

Yangiliklarga obuna bo‘lish