Норбекова Мадина Шуҳрат қизининг
фалсафа доктори (PhD) диссертацияси ҳимояси ҳақида эълон
I. Умумий маълумотлар.
Диссертация мавзуси, ихтисослик шифри (илмий даража бериладиган фан тармоғи): “Ўзбек тили миллий корпуси учун илмий-техник матнлар базасини”, 10.00.11 – Тил назарияси. Амалий ва компютер лингвистикаси.
Диссертация мавзуси рўйхатга олинган рақам: В2024.4.PhD/Fil5438.
Илмий раҳбар: Раупова Лайло Раҳимовна, филология фанлари доктори, профессор.
Диссертация бажарилган муассаса: Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети.
ИК фаолият кўрсатаётган муассаса номи, ИК рақами: Мирзо Улуғбек номидаги Ўзбекистон Миллий университети, DSc.03/25.08.2021.Fil.01.16.
Расмий оппонентлар: Тоирова Гули Ибрагимовна филологийа фанлари доктори, профессор, Абдурахманова Нилуфар Зайнобиддин қизи филологийа фанлари доктори, профессор
Етакчи ташкилот: Андижон давлат чет тиллар институти.
Диссертация йўналиши: назарий ва амалий аҳамиятга молик.
II. Тадқиқотнинг мақсади Ўзбек тили миллий корпуси учун илмий-техник матнлар базасини шакллантиришнинг назарий ва дастурий асосларини ишлаб чиқиш, илмий-техник матнлардаги лексик бирликларни лингвистик теглаш ва ўзбек тилидаги илмий-техник матнлар базасини таснифлашдан иборат.
III. Тадқиқотнинг илмий янгилиги:
корпус ва унинг лингводидактика ва лингвистика соҳаларидаги маълумотларни марказлаштириш ва қайта ишлаш имкониятлари, шунингдек, корпусдан самарали фойдаланишнинг аҳамияти асосланган;
ўзбек тили миллий корпусидаги илмий-техник матнларни теглашда таълим, спорт, соғлиқни сақлаш, сиёсат, маданият, об-ҳаво, иқтисодиёт, технология соҳаларидаги илмий матнларнинг ЛДА, ЛСА, НМФ усуллари ва алгоритмлари воситасида ҳттп://топиcмодел.уз/ дастурий таъминоти ишлаб чиқилганлиги исботланган;
ўзбек тили илмий-техник матнларини теглаш усулларидан матнни тушуниш, маълумот олиш, ҳиссиётларни таҳлил қилиш, имлони текшириш, ҳужжатларни умумлаштириш ва машина таржимаси каби НЛП иловаларини ишлаб чиқишда фойдаланиш мумкинлиги далилланган;
матнлар базасини шакллантиришда илмий-техник матнга қўйиладиган талаблар аниқланган, илмий-техник матнларни корпусга жойлаштиришда фойдаланиладиган теглар ишлаб чиқилган ва ўзбек тили миллий корпусида семантик аннотациялаш имконини берувчи илмий-техник матнлардаги ўзига хосликлар таҳлиллар асосида аниқланган.
IV. Тадқиқот натижаларининг жорий қилиниши. Ўзбек тили миллий корпуси учун илмий-техник матнлар базасини яратиш бўйича олинган илмий натижалар асосида:
илмий техник матнларнинг таржима вариантларидан фойдаланишда бу тур матнларнинг информацион, яхлитлик, изчиллик, терминологик хусусиятларига эътибор қаратиш хусусидаги хулосалардан ПФ-201912258 – “Ўзбек адабиётининг кўп тилли (ўзбек, рус, инглиз тилларида) электрон платформасини яратиш” мавзусидаги амалий лойиҳада (2021–2023) фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2024-йил 6-декабрдаги 04/1-4044-рақамли маълумотномаси). Натижада электрон платформага оид илмий-техник матнлар базаси янги маълумотлар билан бойитилган.
диссертацияни тайёрлаш жараёнида шакллантирилган дастурий таъминот маълумотлар базасидан, теглаш тизимидан, аннотациялаш тамойилларининг хулосаларидан АМ-Ф3-201908172 рақамли “Ўзбек тилининг таълимий корпусини яратиш” мавзусидаги амалий лойиҳада (2020-2023) фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2024-йил 10-декабрдаги 04/1-4085-рақамли маълумотномаси). Натижада тадқиқотда келтирилган илмий-техник материаллар, тематик моделлаштириш алгоритмлари, яширин семантик таҳлил ҳақидаги таклифлар корпус мазмуни ва амлий жиҳатини бойитишга хизмат қилган.
- тадқиқот натижаларининг амалий аҳамияти ўзбек тили миллий корпуси учун илмий-техник матнлар базасини яратиш, унинг семантик ва грамматик структурасини аниқлаш, шунингдек, матнни автоматик ишлаш ва таҳлил қилиш усулларини ишлаб чиқишдаги хулосалардан 2024-йилнинг 24-декабрдаги 06-28-845-сонли маълумотнома асосида Ўзбекистон миллий телерадиокомпаниясининг “Ўзбекистон тарихи” телеканалининг “Ҳамма учун” дастури сценарийсини ёзишда фойдаланилган.