Нуткни автоматик таниб олиш муаммолари ва ечимлари
- № 4 (52) 2019
Страницы:
105
–
118
Язык: узбекский
Аннотация
В последние годы наблюдается существенное развитие в автоматическом распознавании речи и достигаются больших успехов. Но возможности существующих средств автоматического распознавания речи намного ограничены чем человеческие возможности. Например, человек без никаких затруднений легко распознаёт удалённую, некачественную или шумную, а также акцентную речь. Кроме того, человек имеет возможность распознавания спонтанной речи и определённого голоса диктора среди множества голосов. Такие человеческие возможности, особенно последние, создают много проблем при создании современных систем распознавания речи. А существующие системы автоматического распознавания речи являются преимущественным чем человек при распознавании выделенных команд и чисел.Существующие системы распознавания речи связаны с усовершенствованием нейро-сетевых структур, обеспечением различных обратных связей и разработкой новых методов обучения, где целесообразно применение разработок из области семантики, в которых можно выделить смысловую часть состава речи и использование их возможностей.В статье приведены короткий обзор в настоящее время широко применяемых приложений автоматического распознавания речи, их особенности, основные этапы их развития. А также рассмотрен метод решения задачи распознавания речи на основе Марковских цепей, сравнительный анализ подходов и методов моделирования контексосвязанных трифонов и бифонов при решении проблемы коартикуляция и адаптация моделей, показаны роли разработки систем, обеспечивающих инвариантность аддитивных шумов и каналов связи, нормализация признаков дикторонезависимых систем. Для разработки эффективной системы автоматического распознавания речи предложен метод глубоких и рекуррентных нейронных сетей. Отмечено сходство глубоких (многослойных) нейронных сетей с биологическими системами. В заключении описаны проблемы и недостатки современных систем распознавания речи и дано предложение их развития.
Сунгги йилларда нуткни автоматик таниб олишда сезиларли ривожланишлар кузатилиб, куплар ютукларга эришмокда. Бирок, нуткни автоматик таниб олишнинг мавжуд воситалари инсон имкониятларига нисбатан анча чегаралангандир. Масалан, инсон узокдаги нуткни, сифатсиз узатилган ёки шовкинга эга хамда акцентли нуткни кийинчиликсиз таниб олади. Бундан ташкари инсон куплаб овозлар орасидан маълум сухандон ва унинг нуткини ажратиб олиш ва спонтан нуткни таниб олиш имкониятига хам эга. Инсоннинг бундай имкониятларидан айникса, сунглари нуткни таниб олишнинг замонавий тизимларини яратишда куплаб муаммоларни келтириб чикаради. Нуткни автоматик таниб олишнинг мавжуд тизимлари эса факатгина ажратилган буйруклар ёки сонларни таниб олишда инсондан устун булиб келмокда. Нуткни таниб олишнинг мавжуд тизимлари нейрон тармоклар структураларини мукаммаллаштириш, улардаги турли даражадали тескари алокаларни таъминлаш ва укитишни янги усулларини ишлаб чикиш билан боплик булиб, унда нутк таркибининг маъноли кисмини колдирувчи семантика сохасидаги ишланмаларни куллаш хамда уларни имкониятларидан фойдаланиш максадга мувофик булади.Мазкур маколада нуткни автоматик таниб олишнихозирги кунда кенг кулланилаётган иловаларининг кискача тавсифлари, узига хос хусусиятлари, ривожланишининг асосий боскичлари келтирилган булиб, унда ушбу масалани ечиш учун Марков занжирлари асосида нуткни таниб олиш усули куриб чикилган. Бундан ташкари, нуткни таниб олиш масаласини ечишга каратилган ёндашувларнинг киёсий тахлили хамда коартикуляция муаммосини ечишда контекстга бог.лик трифонлар ва бифонларни моделлаштириш йулларихамдамоделларни адаптация килиш, белгиларни нормаллаштиришнинг сухандонга бог.лик булмаган, алока канали ва аддитив халакитларга инвариантлик таъминланган тизимларни ишлаб чикишдаги роли курсатилган. Нуткни автоматик таниб олиш самарадор тизимларини ишлаб чикиш усули сифатида чукур нейрон тармоклар ва рекуррент нейрон тармоклари келтирилган. Купкатламли нейрон тармокларнинг биологик тизимлар билан ухшашлиги асослаб берилган. Хулосада нуткни таниб олишнинг замонавий тизимлари муаммо ва камчиликлари баён этилиб, ривожлантириш учун тавсиялар келтирилган.
In recent years, there has been a significant development in automatic speech recognition and great success has been achieved. But the capabilities of existing automatic speech recognition tools are much more limited than human capabilities. For example, a person without any difficulties easily recognizes remote, substandard or noisy, as well as accent speech. In addition, a person has the ability to recognize spontaneous speech and a certain voice announcer among many voices. Such human capabilities, especially the latter, create many problems when creating modern speech recognition systems. And existing systems of automatic speech recognition are predominant than a person in recognizing selected commands and numbers.Existing speech recognition systems are associated with the improvement of neural network structures, the provision of various feedbacks and the development of new teaching methods, where it is advisable to use developments from the field of semantics in which the semantic part of speech composition and the use of their capabilities can be distinguished.The article provides a brief overview of currently widely used automatic speech recognition applications, their features, the main stages of their development. We also considered a method for solving the speech recognition problem based on Markov chains, a comparative analysis of approaches and methods for modeling context-related triphons and biphons in solving the problem of co-articulation and adaptation of models; For the development of an effective automatic speech recognition system, a method of deep and recurrent neural networks has been proposed. The similarity of deep (multilayer) neural networks with biological systems is noted. In conclusion, the problems and shortcomings of modern speech recognition systems are described and a proposal for their development is given.
Сунгги йилларда нуткни автоматик таниб олишда сезиларли ривожланишлар кузатилиб, куплар ютукларга эришмокда. Бирок, нуткни автоматик таниб олишнинг мавжуд воситалари инсон имкониятларига нисбатан анча чегаралангандир. Масалан, инсон узокдаги нуткни, сифатсиз узатилган ёки шовкинга эга хамда акцентли нуткни кийинчиликсиз таниб олади. Бундан ташкари инсон куплаб овозлар орасидан маълум сухандон ва унинг нуткини ажратиб олиш ва спонтан нуткни таниб олиш имкониятига хам эга. Инсоннинг бундай имкониятларидан айникса, сунглари нуткни таниб олишнинг замонавий тизимларини яратишда куплаб муаммоларни келтириб чикаради. Нуткни автоматик таниб олишнинг мавжуд тизимлари эса факатгина ажратилган буйруклар ёки сонларни таниб олишда инсондан устун булиб келмокда. Нуткни таниб олишнинг мавжуд тизимлари нейрон тармоклар структураларини мукаммаллаштириш, улардаги турли даражадали тескари алокаларни таъминлаш ва укитишни янги усулларини ишлаб чикиш билан боплик булиб, унда нутк таркибининг маъноли кисмини колдирувчи семантика сохасидаги ишланмаларни куллаш хамда уларни имкониятларидан фойдаланиш максадга мувофик булади.Мазкур маколада нуткни автоматик таниб олишнихозирги кунда кенг кулланилаётган иловаларининг кискача тавсифлари, узига хос хусусиятлари, ривожланишининг асосий боскичлари келтирилган булиб, унда ушбу масалани ечиш учун Марков занжирлари асосида нуткни таниб олиш усули куриб чикилган. Бундан ташкари, нуткни таниб олиш масаласини ечишга каратилган ёндашувларнинг киёсий тахлили хамда коартикуляция муаммосини ечишда контекстга бог.лик трифонлар ва бифонларни моделлаштириш йулларихамдамоделларни адаптация килиш, белгиларни нормаллаштиришнинг сухандонга бог.лик булмаган, алока канали ва аддитив халакитларга инвариантлик таъминланган тизимларни ишлаб чикишдаги роли курсатилган. Нуткни автоматик таниб олиш самарадор тизимларини ишлаб чикиш усули сифатида чукур нейрон тармоклар ва рекуррент нейрон тармоклари келтирилган. Купкатламли нейрон тармокларнинг биологик тизимлар билан ухшашлиги асослаб берилган. Хулосада нуткни таниб олишнинг замонавий тизимлари муаммо ва камчиликлари баён этилиб, ривожлантириш учун тавсиялар келтирилган.
In recent years, there has been a significant development in automatic speech recognition and great success has been achieved. But the capabilities of existing automatic speech recognition tools are much more limited than human capabilities. For example, a person without any difficulties easily recognizes remote, substandard or noisy, as well as accent speech. In addition, a person has the ability to recognize spontaneous speech and a certain voice announcer among many voices. Such human capabilities, especially the latter, create many problems when creating modern speech recognition systems. And existing systems of automatic speech recognition are predominant than a person in recognizing selected commands and numbers.Existing speech recognition systems are associated with the improvement of neural network structures, the provision of various feedbacks and the development of new teaching methods, where it is advisable to use developments from the field of semantics in which the semantic part of speech composition and the use of their capabilities can be distinguished.The article provides a brief overview of currently widely used automatic speech recognition applications, their features, the main stages of their development. We also considered a method for solving the speech recognition problem based on Markov chains, a comparative analysis of approaches and methods for modeling context-related triphons and biphons in solving the problem of co-articulation and adaptation of models; For the development of an effective automatic speech recognition system, a method of deep and recurrent neural networks has been proposed. The similarity of deep (multilayer) neural networks with biological systems is noted. In conclusion, the problems and shortcomings of modern speech recognition systems are described and a proposal for their development is given.