Andrew Krizhanovsky » Publication
Published
2008-09-16
Published on SciPeople2009-04-23 00:04:03
Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов
Автореф. ... канд. техн. наук: 05.13.11. — Санкт-Петербург, 2008. — 18 с
Abstract
Предложен подход к поиску семантически близких слов на основе рейтинга вики-текстов и учёта метаинформации (ключевые слова; категории, классифицирующие документы по их тематической принадлежности; гиперссылки) в проблемно-ориентированном корпусе текстовых документов с двумя типа отношений: иерархические отношения (родо-видовые и часть – целое) и гиперссылки. В основу подхода положен новый способ построения корневого набора документов, заключающийся в указании исходного документа пользователем и формировании списка «смежных документов» (документов, связанных ссылками с исходным документом), и механизм иерархической кластеризации, позволяющий объединять слова в смысловые группы. Разработан программный комплекс для поиска семантически близких слов с возможностью их оценки на основе тезаурусов (WordNet, Moby) и динамической визуализации результатов поиска. Данный комплекс апробирован на английской и русской версиях энциклопедии Википедия, что позволяет находить энциклопедические статьи, близкие по тематике к заданным, для более углублённого изучения некоторого понятия; а также устанавливать недостающие ссылки между связанными по смыслу статьями.

http://whinger.narod.ru/paper/phd/autoreferat_synonym_search_wp.pdf
http://whinger.narod.ru/paper/index.html#phd
Show statistics