Графический подход к проблеме нечеткого поиска фрагмента

реклама
УДК 004(06) Компьютерные системы и технологии
Г.Г. НОВИКОВ
ООО "Дуайен Консалтинг Сервис", Москва
ГРАФИЧЕСКИЙ ПОДХОД К ПРОБЛЕМЕ НЕЧЕТКОГО ПОИСКА ФРАГМЕНТА ТЕКСТА
Предложен новый подход к задаче количественного определения степени релевантности. В основу метода положено представление сравниваемых фрагментов текстов как совокупность графических примитивов.
Определяется метод представления текстовой информации в виде графических примитивов, при котором
слова поискового шаблона и исследуемого текста абстрагируются от смыслового значения и рассматриваются как своего рода «пиксели», формирующие картину документа. Наличие возможности для сравнения
таких «пикселей» позволило построить метод нечеткого поиска с учетом геометрии и плотности совпадений
на странице исследуемого текста. В работе рассматривается как сам метод поиска, так и подход к его практической реализации.
Скачать