Повышение достоверности информации систем мониторинга организационно — распорядительной деятельности
- № 2 (50) 2019
Страницы:
2
–
12
Язык: русский
Аннотация
Разработаны методы повышения достоверности информации с механизмами определения рационального размера наборов-эталона, интервала принадлежности достоверных элементов, редукции избыточных элементов, семантического поиска документа, извлечения статистических, специфических характеристик информации.Предложены правила регулирования количества сегментов, левой и правой границ сегментов, размера набор-эталона элементов документа для минимизации общей вероятности необнаруженных ошибок.Исследована эффективность алгоритма повышения достоверности информации на основе определения оптимальных границ разделения достоверной и недостоверной части информации по функциям условного распределения.Разработан и реализован программный комплекс повышения достоверности информации с модулями предварительной обработки документов с выполнением поиска, распознавания, кластеризации и сегментации, настройки границ сегментов элементов документа, проверки достоверности информации по эквивалентности элементов и взаимной эквивалентности сегментов и наборов.
Эталон-жамламанинг кулан улчамини, ишончга эга элементлар тегишлилик интервалини, ортикча булган элементларни редукцияловчи, хужжатни семантик равишда кидирувчи, маълумотлардан статистик, хусусий таснифларини ажратувчи механизмларга эга булган ахборот ишончлигини ошириш усуллари ишлаб чикилган. Хатоларни аникламаслик умумий эхтимолини минималлаштир учун хужжат элементи сегментлари сонини, сегмент чап ва унг чегараларини, эталон — жамлама кулай улчамини мувофиклаштирувчи коидалар таклиф этилган. Шартли таксимот функцияси буйича маълумотларнинг ишончли ва ишончсиз булган кисмларини булакловчи макбул чегараларни аниклаш асосида ахборот ишончлилигини ошириш алгоритми самарадорлиги тадкик килинган. Хужжатларга дастлабки ишлов беришда кидириш, таниш, кластерлаш ва сегментлаш амалларини бажарувчи, хужжат элементи сегментлари чегараларини мувофиклаштирувчи, элементлар эквивалентлиги хамда сегмент ва жамламаларнинг узаро эквивалентлигини текшириш модулларига эга булган ахборот ишончлигини оширувчи дастурий мажмуа ишлаб чикилган ва жорийлаштирилган.
In this article have been developed methods for increasing the information reliability with mechanisms for determining the rational size of a set of standard, the interval of belonging of reliable elements, reduction of redundant elements, semantic search for a document, extraction of statistical, specific characteristics of information. The rules for regulating the number of segments, the left and right borders of the segments, the size of the set of the standard elements of the document to minimize the overall probability of undetected errors are proposed. The effectiveness of the algorithm for increasing the reliability of information have been investigated on the basis of determining the optimal boundaries for separating reliable and unreliable parts of information by conditional distribution functions. Developed and implemented a software package to increase the information reliability with the modules of document preprocessing with the search, recognition, clustering and segmentation, setting the boundaries of segments of document elements, checking the accuracy of information on the equivalence of elements and mutual equivalence of segments and sets.
Эталон-жамламанинг кулан улчамини, ишончга эга элементлар тегишлилик интервалини, ортикча булган элементларни редукцияловчи, хужжатни семантик равишда кидирувчи, маълумотлардан статистик, хусусий таснифларини ажратувчи механизмларга эга булган ахборот ишончлигини ошириш усуллари ишлаб чикилган. Хатоларни аникламаслик умумий эхтимолини минималлаштир учун хужжат элементи сегментлари сонини, сегмент чап ва унг чегараларини, эталон — жамлама кулай улчамини мувофиклаштирувчи коидалар таклиф этилган. Шартли таксимот функцияси буйича маълумотларнинг ишончли ва ишончсиз булган кисмларини булакловчи макбул чегараларни аниклаш асосида ахборот ишончлилигини ошириш алгоритми самарадорлиги тадкик килинган. Хужжатларга дастлабки ишлов беришда кидириш, таниш, кластерлаш ва сегментлаш амалларини бажарувчи, хужжат элементи сегментлари чегараларини мувофиклаштирувчи, элементлар эквивалентлиги хамда сегмент ва жамламаларнинг узаро эквивалентлигини текшириш модулларига эга булган ахборот ишончлигини оширувчи дастурий мажмуа ишлаб чикилган ва жорийлаштирилган.
In this article have been developed methods for increasing the information reliability with mechanisms for determining the rational size of a set of standard, the interval of belonging of reliable elements, reduction of redundant elements, semantic search for a document, extraction of statistical, specific characteristics of information. The rules for regulating the number of segments, the left and right borders of the segments, the size of the set of the standard elements of the document to minimize the overall probability of undetected errors are proposed. The effectiveness of the algorithm for increasing the reliability of information have been investigated on the basis of determining the optimal boundaries for separating reliable and unreliable parts of information by conditional distribution functions. Developed and implemented a software package to increase the information reliability with the modules of document preprocessing with the search, recognition, clustering and segmentation, setting the boundaries of segments of document elements, checking the accuracy of information on the equivalence of elements and mutual equivalence of segments and sets.