Andrew Krizhanovsky » Publication
Share It:
Published
2010-03-20
Published on SciPeople2010-03-26 12:51:22
Journal(презентация в pdf)
Построение машинно-читаемого словаря на основе Русского Викисловаря
Abstract
Для хранения лексикографической информации Русского Викисловаря разработаны (1) правила (на основе регулярных выражений) извлечения текстовых данных, (2) структура базы данных для хранения данных, (3) программный интерфейс к этой базе данных. Созданный машинно-читаемый словарь был использован в эксперименте для сравнения алгоритмов, вычисляющих семантическое расстояние на основе данных Русского Викисловаря и WordNet. Алгоритмы и метрики оценивались с помощью тестовой коллекции (из 353 пар английских слов), включающей оценку экспертов. Эксперимент показал, что предложенный метод позволяет вычислить семантическое расстояние между парой слов, в принципе, на любом из языков, представленных в Русском Викисловаре.

http://www.livestream.com/nlpseminar/video?clipId=pla_eb327355-4e08-44d9-8511-6863ca037bd5
14_nlpseminar_aot_ruwikt_ru.pdf
Show statistics