РОССИЙСКАЯ ФЕДЕРАЦИЯ ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ Номер регистрации (свидетельства): 2016662056 Дата регистрации: 28.10.2016 Номер и дата поступления заявки: 2016619531 08.09.2016 Дата публикации: 20.11.2016 Авторы: Петров Андрей Николаевич, Коробейников Алексей Андреевич, Шашев Сергей Александрович, Каменцев Степан Алексеевич, Власов Дмитрий Валерьевич Правообладатель: федеральное государственное бюджетное научное учреждение «Дирекция научно-технических программ» Название программы для ЭВМ: Система анализа заимствований «Семантический детектор» Реферат: Программа предназначена для проведения анализа научно-технических проектов на наличие заимствований. Программа позволяет проводить не только стандартный анализ на прямое копирование, но и анализ смысловых заимствований. Программа обеспечивает выполнение следующих функций: автоматическая лингвистическая предобработка текста, включающая лемматизацию и фильтрацию незначимых слов; поддержка статистических подходов к выявлению заимствований: классическое шинглирование при прямом копировании больших кусков текста, анализ заимствований на уровне предложений с использованием н-граммной модели, с учетом перестановок слов; возможность проведения семантического анализа проектов на наличие смысловых заимствований; гибкая настройка фильтрации результатов анализа на заимствования в реальном времени по различным факторам, включая тип сравниваемых объектов; визуализация результатов работы системы для упрощения проведения анализа специалистом, включая наглядное сравнение заимствованных блоков текста в исходном и анализируемом документе; возможность анализировать сложные проекты, состоящие из нескольких этапов и множества текстовых документов. Тип реализующей ЭВМ: IBM РС - совмест. ПК Язык программирования: Scala, Java, JavaScript, CSS Вид и версия операционной системы: Linux Объем программы для ЭВМ: 31 Мб