РОССИЙСКАЯ ФЕДЕРАЦИЯ
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ

Номер регистрации (свидетельства): 2016619579

Дата регистрации: 24.08.2016

Номер и дата поступления заявки: 2016616889 29.06.2016

Дата публикации: 20.09.2016

Контактные реквизиты:
(8152)40 34 30, plyasunovala@mstu.edu.ru
	
Авторы:
Кацуба Валентина Сергеевна,
Кузнецова Ксения Валерьевна

Правообладатель:
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Мурманский государственный технический университет» (ФГБОУ ВПО «МГТУ»)

Название программы для ЭВМ:
Normalizer - программа нормализации текста на основе словаря терминов

Реферат:
Программа на вход получает текст в виде строк в кодировке UTF8, осуществляет разбиение строк на слова, классифицирует и нормализует последние, приводя их к каноническому виду, представленному в словаре. Для разрешения неоднозначностей в выборе ближайшего слова используется оценка на основе метрики Дамерау-Левенштейна. Слова, не распознанные в качестве терминов, исключаются из входной последовательности. Полученный набор нормализованных слов (терминов) анализируется на предмет выявления составных терминов путём итеративной процедуры объединения соседних простых (однословных) терминов. Выходом программы является нормализованный текст. Программа предназначена для использования в системах анализа текстовой информации.

Тип реализующей ЭВМ: IBM РС-совмест. ПК

Язык программирования: С++

Вид и версия операционной системы: Windows XP/2000/2003/7

Объем программы для ЭВМ: 4 Кб