Andrew Krizhanovsky » Publication

Share It:
Blog It:
Published 2008-09-16 Published on SciPeople2009-04-22 23:57:53
Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов
Крижановский А. А. / Andrew Krizhanovsky
Дисс. ... канд. техн. наук: 05.13.11. — Санкт-Петербург, 2008. — 188 с
Abstract Предложен подход к поиску семантически близких слов на основе рейтинга вики-текстов и учёта метаинформации (ключевые слова; категории, классифицирующие документы по их тематической принадлежности; гиперссылки) в проблемно-ориентированном корпусе текстовых документов с двумя типа отношений: иерархические отношения (родо-видовые и часть – целое) и гиперссылки. В основу подхода положен новый способ построения корневого набора документов, заключающийся в указании исходного документа пользователем и формировании списка «смежных документов» (документов, связанных ссылками с исходным документом), и механизм иерархической кластеризации, позволяющий объединять слова в смысловые группы. Разработан программный комплекс для поиска семантически близких слов с возможностью их оценки на основе тезаурусов (WordNet, Moby) и динамической визуализации результатов поиска. Данный комплекс апробирован на английской и русской версиях энциклопедии Википедия, что позволяет находить энциклопедические статьи, близкие по тематике к заданным, для более углублённого изучения некоторого понятия; а также устанавливать недостающие ссылки между связанными по смыслу статьями.

No comments

You should sign in or sign up for comment this post