Семантическая кластеризация текстов предметных языков (морфология и синтаксис)

Михайлов Д.В., Емельянов Г.М.

Аннотация:
Рассматривается задача семантической кластеризации текстов предметного Естественного Языка. Предложен подход к выработке критериев качества синтаксического анализа как инструментального средства выделения объектов и признаков. Особое внимание уделяется Расщепленным Значениям и конверсивам в составе синтаксических контекстов существительных.

Ключевые слова:
понимание текстов, естественный язык, предметная область, семантическая эквивалентность, кластеризация знаний, теория решеток.

Литература:

  1. Тихомиров, И.А. Интеграция лингвистических и статистических методов поиска в поисковой машине "Exactus" [Электронный ресурс] / И.А. Тихомиров, И.В. Смирнов // Межд. Конф. по компьютерной лингвистике "Диалог-2008". http://www.dialog-21.ru/dialog2008/ materials/html/80.htm (дата обращения: 18.11.2009).
  2. Васильев, В.И. Методологические правила конструирования компьютерных тестов [Текст] / В.И. Васильев, А.Н. Демидов, Н.Г. Малышев, Т.Н. Тягунова - М.: МГУП, 2000. – 64 с.
  3. Мельчук, И.А. Опыт теории лингвистических моделей "СмыслÛтекст": Семантика, синтаксис [Текст] / И.А. Мельчук. – М.: Шк. "Языки русской культуры", 1999. – 345 с.
  4. Mikhailov, D.V. Formation and clustering of Russian's nouns's contexts within the frameworks of Splintered Values [Текст] / D.V. Mikhailov, G.M. Emelyanov, N.A.  Stepanova // 9th Int. Conf. "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). – Nizhni Novgorod. – NNSU. – 2008. – Vol.2. – P. 39-42.
  5. Осипов, Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии [Текст] / Г.С. Осипов. – М.: Наука, 1997. – 112 с.
  6. Ножов, И.М. Синтаксический анализ [Электронный ресурс] / И.М. Ножов // Компьютерра. – 2002. – №21 (446). http://www.computerra.ru/offline/2002/446/18250/ (дата обращения: 18.11.2009).
  7. Емельянов, Г.М. Концептуально-ситуационное моделирование процесса перифразирования высказываний Естественного Языка как обучение на основе прецедентов [Текст] / Г.М. Емельянов, А.Н. Корнышов, Д.В. Михайлов // Искусственный интеллект. – 2006. - №2. – С. 72-75.
  8. Кибрик, А.Е. Очерки по общим и прикладным вопросам языкознания / А.Е. Кибрик. – М.: КомКнига, 2005. – 332 с. 
  9. Ganter, B. Formal Concept Analysis – Mathematical Foundations [Текст] / Ganter B. and Wille R. - Berlin : Springer-Verlag, 1999. - 284 с.
  10. Программный пакет синтаксического разбора и машинного перевода [Электронный ресурс] // http://cs.isa.ru:10000/dwarf/ (дата обращения: 18.11.2009).
  11. The Concept Explorer [Электронный ресурс] // http://conexp.sourceforge.net (дата обращения: 18.11.2009).
  12. Гусев, В.Д. Алгоритм выявления устойчивых словосочетаний с учетом их вариативности (морфологической и комбинаторной) [Электронный ресурс] / В.Д. Гусев, Н.В. Саломатина // Межд. Конф. по компьютерной лингвистике "Диалог-2004". http://www.dialog-21.ru/Archive/2004/Salomatina.htm (дата обращения: 18.11.2009).

© 2009, ИСОИ РАН
Россия, 443001, Самара, ул. Молодогвардейская, 151; электронная почта: ko@smr.ru ; тел: +7 (846 2) 332-56-22, факс: +7 (846 2) 332-56-20