РОССИЙСКАЯ ФЕДЕРАЦИЯ ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ Номер регистрации (свидетельства): 2016612903 Дата регистрации: 14.03.2016 Номер и дата поступления заявки: 2015661401 24.11.2015 Дата публикации: 20.04.2016 Контактные реквизиты: Krivonos_DS@nrcki.ru Авторы: Рыбка Роман Борисович, Сбоев Александр Георгиевич, Молошников Иван Александрович, Гудовских Дмитрий Владимирович Правообладатель: Федеральное государственное бюджетное учреждение «Национальный исследовательский центр «Курчатовский институт» Название программы для ЭВМ: «Программа построения дерева синтаксического разбора на основе нейронных сетей» Реферат: Программа реализует модель процедуры синтаксического разбора предложения в формате Национального Корпуса Русского Языка, основанную на нейросетевых алгоритмах. Программа реализована на базе алгоритмов инкрементального разбора, глубокого обучения и нейронных сетей. Входными файлами для работы программы являются предложения с указанием морфологических признаков слов в нем в формате CoNLL. Выходными данными является результат синтаксического разбора с указанием типа синтаксических связей для каждого слова и его родителя. В процессе выполнения программы последовательно, начиная с этапа получения данных, проводится экстракция дополнительных признаков с использованием классификационных нейросетевых алгоритмов и цикл разбора, включающий: формирование вектора признаков, описывающего текущее состояние разбора; его векторизация и обработка посредством классификатора на базе машины опорных векторов с линейным ядром. Тестирование разработанной программы на данных Национального Корпуса Русского Языка показывает, что средняя точность установления синтаксических отношений составляет 89.9%, установления связей без типов синтаксических отношений - 91.7%, построения дерева синтаксического разбора с указанием типов синтаксических связей - 35.9%, построение синтаксических структур предложений без типов синтаксических связей - 52.3%. Тип реализующей ЭВМ: IBM PC-совмест. ПК Язык программирования: Python Вид и версия операционной системы: Linux Объем программы для ЭВМ: 2 Мб