Қарор дарахти алгоритмидан фойдаланиб матнларни таснифлаш
- № 4 (10) 2019
Страницы:
22
–
24
Язык: узбекский
Аннотация
Таснифлаш объектни олдиндан маълум бўлган синфлардан бирига тегишлилигини аниқлайди.Матнларни таснифлаш компьютерли лингвистика масаласи бўлиб, бунда ҳужжатнинг мазмунига кўра уни олдиндан берилган бир неча рукнлардан бирига тегишлилигини аниқлаш амалга оширилади. Ҳозирги кунда матнларни таснифлашнинг кўплаб усуллари ишлаб чиқилган. Масалан, машинали ўқтиш, қарор дарахти, нейрон тўрлари, таянч векторлар ва бошқалар. Мазкур иш қарор дарахти усулидан фойдаланган ҳолда таснифлаш механизмини қуриш масаласи ечишга бағишланган бўлиб, унда ўзбек тилидаги матнлардан иборат ҳужжатларни таснифлаш учун қарор дарахти алгоритми атрибутлар қийматларини аниқлаш (Information Gain, Gain Ratio, Gini index), қарор дарахти алгоритмининг иш самарадорлигини ошириш ва тажрибавий тадқиқот натижалари келтирилган.
The classification determines whether the object belongs to one of the previously known classes. Classification of texts is a matter of computer linguistics, to determine whether the document refers to one of the few chapters previously given. Currently, many ways of classifying texts have been developed. For example, machine learning, decision tree, neural nets, base vectors, and more. The present work is devoted to solving the problem of constructing a classification mechanism using the decision tree method.
The classification determines whether the object belongs to one of the previously known classes. Classification of texts is a matter of computer linguistics, to determine whether the document refers to one of the few chapters previously given. Currently, many ways of classifying texts have been developed. For example, machine learning, decision tree, neural nets, base vectors, and more. The present work is devoted to solving the problem of constructing a classification mechanism using the decision tree method.