РОССИЙСКАЯ ФЕДЕРАЦИЯ ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ Номер регистрации (свидетельства): 2016662505 Дата регистрации: 11.11.2016 Номер и дата поступления заявки: 2016619107 24.08.2016 Дата публикации: 20.12.2016 Авторы: Мамедов Эльдар Интизамович, Лагутина Ксения Владимировна, Парамонов Илья Вячеславович, Лагутина Надежда Станиславовна Правообладатель: Федеральное государственное бюджетное образовательное учреждение высшего образования «Ярославский государственный университет им. П.Г. Демидова» Название программы для ЭВМ: ПРОГРАММА ДЛЯ ПОСТРОЕНИЯ, АНАЛИЗА И ОЦЕНКИ АВТОМАТИЧЕСКИ ГЕНЕРИРУЕМЫХ ТЕЗАУРУСОВ Реферат: Программа предназначена для построения, изучения, анализа и оценки тезаурусов, автоматически генерируемых на основе корпуса текстов. В качестве входных данных программе поступает корпус текстов на русском языке. Программа автоматически извлекает ключевые фразы из корпуса с поддержанием условия хорошей связности текстов по общим ключевым фразам, генерирует на их основе тезаурус с указанием различных типов связей: синонимии, гиперонимии, ассоциации. Также программа вычисляет основные числовые характеристики тезауруса. Программа предоставляет консольный интерфейс и принимает следующие аргументы: -с - путь к директории с корпусом текстов, -о - путь к директории с результатами работы программы, -t - путь к директории, содержащей тезаурус. Результаты работы представлены в виде текстовых файлов, содержащих список числовых характеристик тезауруса и описание тезауруса в виде списка терминов с указанием связей между ними. Тип реализующей ЭВМ: IBM PC - совмест. ПК Язык программирования: Python, Java Вид и версия операционной системы: Linux, Windows Объем программы для ЭВМ: 26,4 Мб