Уразалиева Мавлуда Янгибоевнанинг
филология фанлари бўйича фалсафа доктори (PhD) диссертацияси ҳимояси ҳақида эълон
I. Умумий маълумотлар.
Диссертация мавзуси, ихтисослик шифри (илмий даража бериладиган фан тармоғи номи): “Ўзбек тили аудиокорпусининг лингвистик таъминотини яратиш”.
10.00.11 – Тил назарияси. Амалий ва компютер лингвистикаси.
Диссертация мавзуси рўйхатга олинган рақам: В2025.2.PhD/Fil6409
Илмий раҳбар: Абдурахмонова Нилуфар Зайнобиддин қизи, филология фанлари доктори, профессор.
Диссертация бажарилган муассаса: Ўзбекистон Миллий университети
ИК фаолият кўрсатаётган муассаса номи, ИК рақами: Мирзо Улуғбек номидаги Ўзбекистон Миллий университети, DSc.03/2025.27.12.Fil.01.12
Расмий оппонентлар: филология фанлари доктори (DSc), профессор Н.Б.Атабоев; филология фанлари бўйича фалсафа доктори (PhD), доцент Анварбек Турдиалиев
Етакчи ташкилот: Наманган давлат университети
Диссертация йўналиши: назарий ва амалий аҳамиятга молик.
II. Тадқиқотнинг мақсади ўзбек тили табиий тилни қайта ишлаш жараёнлари учун адабий тил меъёрларига асосланган аудиокорпусни шакллантириш ҳамда унинг лингвистик таъминотини ишлаб чиқишдан иборат.
III. Тадқиқотнинг илмий янгилиги қуйидагилардан иборат:
табиий тилни қайта ишлаш (НЛП) технологиялари ёрдамида яратилган нутқий синтезаторлар учун аудиокорпус яратишнинг лингвистик асослари – фонетик, фонологик хусусиятлари илмий исботланган;
фонетик ҳодисаларнинг (элизия, ассимиляция, редуксия, эпентеза каби) автоматик транскрипсия ва морфологик сегментация аниқлигига бевосита таъсири илмий жиҳатдан ўрганилиб, аудиоматн учун токенларга ажратишнинг морфологик таҳлили амалга оширилган ҳамда ЛабелСтудио платформасига аннотацияланган матн фрагментлари сифатида лингвистик база яратишнинг стандарт меъёрлари аниқланган;
ўзбек адабий тилининг аудиокорпуси ҳттпс://узбекcорпус.уз/ платформасига интеграция қилиниб, корпуснинг фойдаланувчи интерфейси тил модели асосида шакллантирилган ҳамда функсионал имкониятлари сифатида ёш, жинс, мулоқот тури (монолог/ диалог), касб, диалект каби метамаълумотларни дастурий таъминотга киритиш ҳамда матнлар репрезентативлиги масаласи илмий асосланган;
ўзбек тили аудио корпуси учун талаффуз меъёрларига таъсир қилувчи урғу масалалари таҳлил қилиниб, ўзбек тилига ўзлашган сўзларнинг урғули луғати лингвистик база сифатида яратилган ҳамда табиий тилни қайта ишлашда тил моделлари учун мос форматда лингвистик базага киритишнинг тил хусусиятлари назарий жиҳатдан далилланган.
IV. Тадқиқот натижаларининг жорий қилиниши. Ўзбек тили аудиокорпусининг лингвистик таъминотини шакллантириш асосида:
Мирзо Улуғбек номидаги Ўзбекистон Миллий университетида амалга оширилган “РЕП-25112021/113 – УзУДТ: Ўзбек тилида табиий тилни қайта ишлаш учун универсал боғлиқлик дарахти корпуси ва унинг семантик таҳлили” мавзусидаги халқаро илмий лойиҳа доирасида диссертацияда ишлаб чиқилган аудиокорпус яратишнинг лингвистик тамойиллари, жумладан фонетик ва фонологик хусусиятларни ҳисобга олган ҳолда нутқий материални моделлаштириш ёндашувлари ҳамда фонетик ҳодисаларнинг (элизия, ассимиляция, редуксия, эпентеза) автоматик транскрипсия ва морфологик сегментация жараёнларига таъсирига оид хулосалар аудиокорпус архитектурасини лойиҳалашда семантик муносабатларни аниқлаш учун назарий асос сифатида фойдаланилган (Мирзо Улуғбек номидаги Ўзбекистон Миллий университетининг 2025-йил 18-июндаги 04/11-7658-сон маълумотномаси).
2024–2025-йилларда бажарилган “Янги сўз ва атамаларнинг ўзбекча муқобилини сунъий интеллект асосида автоматик тақдим қилувчи атамаcом.уз дастурий таъминоти платформаси ва мобил иловаларини яратиш” мавзусидаги амалий лойиҳа жараёнида диссертацияда илгари сурилган аудиоматнларни фонетик жараёнларни инобатга олган ҳолда автоматик қайта ишлаш, морфологик токенлаш ҳамда ЛабелСтудио муҳити асосида аннотацияланган матнлар орқали лингвистик база шакллантириш бўйича илмий натижалар амалиётга татбиқ этилган. Мазкур лойиҳа доирасида ўзбек адабий тилининг аудио корпуси ҳттпс://узбекcорпус.уз/ платформасига жойлаштирилиб, фойдаланувчи интерфейси ёш, жинс, мулоқот шакли (монолог/диалог), касб ва диалект каби метамаълумотлар билан бойитилган, шунингдек матнларнинг репрезентативлигини таъминлаш мезонлари ишлаб чиқилган. Бундан ташқари, урғу билан боғлиқ хусусиятларни ҳисобга олган ҳолда ўзлашган сўзларнинг урғули луғати шакллантирилиб, НЛП асосидаги тил моделлари учун мос тузилмада лингвистик базага киритилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети ҳузуридаги Давлат тилида иш юритиш асосларини ўқитиш ва малака ошириш марказининг 2025-йил 16-сентябрдаги 1531-сонли маълумотномаси).
Шунингдек, Мирзо Улуғбек номидаги Ўзбекистон Миллий университетида амалга оширилган ИЛ-7823051524 рақамли “Паратранслатор: параллел корпусга асосланган контекстологик электрон таржима луғат платформасини яратиш” мавзусидаги инновацион лойиҳа доирасида диссертацияда баён этилган фонетик-фонологик омилларга таянган ҳолда овозли матнларни моделлаштириш, лексик бирликларни морфологик сегментация қилиш ҳамда семантик боғланишлар асосида аудиоматнларни қайта ишлашга оид илмий хулосалар лойиҳа учун методологик манба сифатида фойдаланилган (Мирзо Улуғбек номидаги Ўзбекистон Миллий университетининг 2025-йил 18-июндаги 04/11-7618-сон маълумотномаси).