Sayt test rejimida ishlamoqda

Абдурахмонова Нилуфар Зайнобиддин қизининг 
фан доктори (DSc) диссертацияси ҳимояси ҳақида эълон

I. Умумий маълумотлар.
Диссертация мавзуси, ихтисослик шифри (илмий даража бериладиган фан тармоғи номи): “Ўзбек тили электрон корпусининг компьютер моделлари”, 10.00.11 – Тил назарияси. Амалий ва компьютер лингвистикаси (филология фанлари).
Диссертация мавзуси рўйхатга олинган рақам:  В2019.2.DSc/Fil1174.
Илмий маслаҳатчи: Дадабоев Ҳамидулла Арипович, филология фанлари доктори, профессор. 
Диссертация бажарилган муассаса номи: Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети
ИК фаолият кўрсатаётган муассаса номи, ИК рақами: Ўзбек тили, адабиёти ва фольклори институти, DSc.02/30.12.2019.Fil.46.03.
Расмий оппонентлар: Муҳамедова Саодат Ходайбердиевна, филология фанлари доктори, профессор; Уринбаева Дилбар Базаровна, филология фанлари доктори, доцент; Назирова Элмира Шодмановна, техника фанлари доктори, децент.
Етакчи ташкилот: Фарғона давлат университети.
Диссертация йўналиши: назарий ва амалий аҳамиятга молик.
II. Тадқиқотнинг мақсади ўзбек тили электрон корпусини яратишнинг концептологик моделларини яратиш ҳамда лингвистик аннотацияланган тил корпуси учун компьютер технологиялари методларидан фойдаланишнинг самарали усулларини ишлаб чиқишдан иборат. 
III. Тадқиқотнинг илмий янгилиги:
ўзбек тили учун илк бор FST (finite state trunsducer) чекли автомат трансютери воситасида корпусни морфологик теглашнинг автоматик усули ёрдамида ўзбек тили корпуси учун лемматизация ва токенизация жараёнларининг  лингвистик таҳлил босқичлари ишлаб чиқилган ҳамда морфологик маълумотлар базаси, морфотактик қоидалар тизими шакллантирилган;
корпусни синтактик теглаш ва аннотациялашда универсал тобелик назариясининг UdPipe методи орқали  ConLLU формат намунасида ўзбек тилининг синтактик моделлари аниқланган; 
ўзбек тили корпус менежери (қидирув тизими)нинг лемма, токен бўйича ҳамда н-грам моделли конкорданс қидирув тизими ишлаб чиқилган;
таржима қилиш алгоритми ва ўзбек тили параллел корпусининг таржима хотирасини яратишда WordFast технологияси фойдаланилган ҳамда ўзбек тилининг инглиз ва рус тилларида таржима бирликлари муқобилларининг маълумотлар базаси тузилган; 
корпусда қидирилаётган сўзнинг имловий хатоларини аниқлаш ва унга яқин бўлган сўзлар коеффициентини белгилаш ҳамда натижани қидирув  интерфейсида илова қилишда Джаро Винклер алгоритмини қўллашнинг мақсадга мувофиқ эканлиги асосланган. 
IV. Тадқиқот натижаларининг жорий қилиниши. Ўзбек тили электрон корпусининг компьютер моделлари бўйича олинган илмий ва амалий натижалар сифатида лингвистик аннотациялаш тамойиллари, лисоний моделлари, автоматик усуллари (FST технологияси ва UdPipe усули), корпус менежери, қидирув тизими учун таҳрирловчи дастур каби тадқиқот хулосаларидан:
корпус менежери (қидирув тизими)нинг лемма, токен ҳамда н-грам модели асосида конкордансларнинг қидирув тизими орқали корпусда жамланган илмий услубдаги материаллар ОТ-Ф1-029 рақамли “Ўзбек давлатчилиги тарихида суғдий тил ва ёзувининг тутган ўрни (мил.ав. II – милодий XII асрлар)” (2017-2020) мавзусидаги фундаментал грант лойиҳасини бажаришда мақолалар ва монографияларни тайёрлашда илмий электрон манба сифатида ҳамда платформада яратилган параллел корпуслар ва таржима луғатлардан лойиҳанинг амалий натижаларини хорижий журналларда чоп этишда фойдаланилган (Тошкент давлат ўзбек тили ва адабиёти университетининг 2021 йил 23 сентябрдаги 01/4-1713-сон маълумотномаси).  Натижада лойиҳа бўйича олиб тадқиқотларнинг мазмуний контенти  бойиган, илмий даражаси ошган; 
2017-2019 йилларда амалга оширилган ОТ-Ф1-78 “Ҳозирги глобаллашув даврида ўзбек тили, унинг тарихий тараққиёти ва истиқболлари (вазифавий услублар таҳлили асосида)”номли фундаментал лойиҳасида ўзбек тили лотин ёзувидаги кўп жилдли “Ўзбек тилининг изоҳли луғати”ни тайёрлашда диссертация натижаси сифатида яратилган ўзбек тилининг электрон корпус менежери (қидирув тизими)нинг лемма, токен, конкорданс ҳамда сўз бирикмаси бўйича қидириш каби функционал имкониятларидан фойдаланилган (Ўзбекистон Республикаси Фанлар академиясининг 2021 йил 16 сентябрдаги 3/1255-2651-сон маълумотномаси). Натижада лойиҳа бўйича олиб борилган тадқиқотларнинг мазмуний контенти кенгайган, мақолаларнинг турли контекстда  семантик майдонларда воқеланиши корпус асосида аниқланган.
ўзбек тили корпус менежерининг лемма, токен ҳамда н-грам модели асосида конкордансларнинг қидирув тизимига доир амалий натижаларидан “Маҳалла ва оила” илмий тадқиқот институтининг ЖҲБЛ-18 рақамли “Турли авлод вакилларининг оилавий қадриятларини тадқиқ этиш” (2020-2021) лойиҳасида фойдаланилган (“Маҳалла ва оила” илмий тадқиқот институтининг 2021 йил 25 июндаги 13-сон маълумотномаси). Натижада тадқиқотчилар учун тилда акс этган қадриятларнинг гендер, ёш, ва жинсга доир, қолаверса, миллий хусусиятларини ўрганиш ва илмий жиҳатдан статистикасини аниқлашда асос вазифасини бажарган; 
ўзбек тили электрон корпусини яратишнинг амалий натижаларидан ЖҲБЛ-18 рақамли “Ўзбекистонда “Бахтиёр оила” wеб порталини яратиш” (2020-2021) лойиҳасида, шунингдек электрон корпусдан турли жанрга оид  оила мавзусидаги матнларнинг хронологияси ва илмий тавсифини таҳлил қилиш миллий қадриятлар ва ижтимоий муносабатларни ўрганишда фойдаланилган (“Маҳалла ва оила” илмий тадқиқот институтининг 2021 йил 25 июндаги 12-сон маълумотномаси).  Натижада лойиҳа мавзусига доир тушунчалар янги илмий далиллар билан бойитилган;
ўзбек тили корпус менежерининг лемма, токен бўйича ҳамда n-gram моделли конкорданс қидирув тизимидан I-ОТ-2019-42 рақамли “Ўзбек ва инглиз тилларининг электрон (Инсон қиёфаси, феъл атвори, табиат ва миллий тимсоллар тасвири) поетик луғатини яратиш” (2019-2021) мавзусидаги амалий грант лойиҳасида электрон луғат контентини материаллари билан бойитишда фойдаланилган (Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университетининг 2021 йил 18 сентябрдаги 01/4-1638-сон маълумотномаси). Натижада ўзбек тили электрон корпусининг ички корпус – параллел корпус таржима хотираси ва таржима сегмент бирликларидан фойдаланиб, луғатда акс этган ўзбек ва инглиз тилларида инсон қиёфаси, феъл-атвори, табиат ва миллий тимсолларни ифодаловчи лексик бирликларни тўплаш ва уларнинг инглиз ва ўзбек тилларидаги муқобилларини аниқлашга эришилган;
ўзбек тили корпуси учун лемматизация ва токенизация жараёнларининг  лингвистик таҳлил  босқичлари ишлаб чиқилган ҳамда морфологик маълумотлар базаси, морфотактик қоидалар тизими ҳамда ўзбек тили учун илк бор FST (finite state transducer – чекли автомат трансютери воситасида корпусни морфологик теглашнинг автоматик усули, корпусни синтактик теглаш ва аннотациялашда UdPipe методи орқали   ўзбек тилининг синтактик моделлари базаси асосида ўзбек тили учун универсал тобелик назариясининг ConLLU модели  5111200 – Ўзбек тили ва адабиёти, 5120100 – Филология ва тилларни ўқитиш (ўзбек тили), 5120900 – Ўзбек-инглиз таржима назарияси ва амалиёти  йўналишлари бакалавр талабалари, магистрлар, докторантлар, тадқиқотчилар ва соҳа мутахассислари, шунингдек, малака ошириш ва педагогик кадрларни қайта тайёрлаш курси тингловчиларига мўлжалланган “Компьютер лингвистикаси” дарслигида ўз ифодасини топган (Олий ва ўрта махсус таълим вазирлигининг 2019 йил 20 июлдаги 654-сон буйруғи). Натижада дарсликнинг ғоявий асослари назарий ва амалий жиҳатдан асосланган ҳамда маълумотлар билан бойитилган. 
яратилган http://uzbekcorpus.uz сайти wеб ресурс сифатида Қозон Федерал университетининг Ҳисоблаш математикаси ва ахборот технологиялари институтида компьютер лингвистикаси фанига доир корпус лингвистикаси ҳамда морфологик анализатор каби мавзуларни ўқитишда  фойдаланилмоқда (Қозон федерал университети Ҳисоблаш математикаси ва Ахборот технологиялари институтининг маълумотномаси). Натижада ўзбек тилининг электрон корпуси http://www.turklang.net сайтидаги туркий тил корпуслар рўйхатида илова қилиниб, туркий тилларнинг структур-функционал хусусиятларини қиёслаш ҳамда лингвистик ресурс сифатида табиий тил технологиялардан фойдаланиш имконияти яратилган.

 

Yangiliklarga obuna bo‘lish