РОССИЙСКАЯ ФЕДЕРАЦИЯ ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ Номер регистрации (свидетельства): 2016663883 Дата регистрации: 19.12.2016 Номер и дата поступления заявки: 2016661700 01.11.2016 Дата публикации: 10.01.2017 Контактные реквизиты: нет Авторы: Мамедов Эльдар Интизамович, Лагутина Ксения Владимировна, Парамонов Илья Вячеславович, Лагутина Надежда Станиславовна, Васильев Андрей Михайлович Правообладатель: Федеральное государственное бюджетное образовательное учреждение высшего образования «Ярославский государственный университет им. П.Г. Демидова» Программа для ЭВМ создана по государственному контракту государственный заказчик: Министерство образования и науки Российской Федерации Название программы для ЭВМ: Программный прототип для автоматизированного построения тезаурусов при помощи гибридных методов Реферат: Программа предназначена для построения, изучения и анализа тезаурусов, автоматически генерируемых при помощи гибридных методов. На вход программе подается коллекция русскоязычных текстов, относящихся к одной предметной области. Программа осуществляет построение тезауруса на основе следующего алгоритма: 1. Предварительная обработка текста и выделение терминов при помощи стандартного алгоритма TextRank; 2. Выделение связей между терминами тезауруса: синонимических, гиперонимических, ассоциативных. Последние извлекаются при помощи алгоритма LSA. Синонимические и гиперонимические связи извлекаются при помощи гибридных методов, сочетающих с в себе элементы существующих алгоритмов. Результатом работы программы является текстовый файл, с описанием элементов тезауруса. Каждый элемент содержит в себе название термина и ссылки на другие термины, связанные с первым, с указанием типа связи. Тип реализующей ЭВМ: IBM PC - совмест. ПК Язык программирования: Python, Java Вид и версия операционной системы: Linux, Windows Объем программы для ЭВМ: 30,2 Мб