Уловка компьютерной крысы №10 ( Поточный увод патентов из БД ФИПС )
Защитится ли аспирант-технарь, у которого в его личном “багаже” отсутствуют патенты (на изобретения, полезные модели) или свидетельства о регистрации программы для ЭВМ, БД, топологии интегральных микросхем?
А почему бы и нет? Вполне может проскочить. Ведь диссертация – это, в первую очередь, научная квалификационная работа. Хотя наличие документального подтверждения новизны разработанных в диссертации технических решений ещё никому не мешало на защите. В случае же отсутствия такового, аспиранту придётся заранее поломать свою голову, чтобы убедительно ответить на вопрос членов диссертационного совета: “А чем подтверждается новизна Вашего подхода?”.
Но в случае отсутствия патентов или свидетельств лично у вас (что возможно, но не есть “гуд”), отсутствие упоминания о запатентованных до вас технических решений в обзорной Главе – это, безусловно, полный “аллес капут!”. Поэтому, на мой взгляд, анализ патентов в диссертации на соискание степени кандидата технических наук – просто обязателен. А для этого нужно “шерстить” базы данных патентных ведомств.
Я терпеть не могу американцев, как природное явление, но “обожаю” базу данных Патентного ведомства США, поскольку её структура и организация данных позволяет почти полностью и “за без мани” автоматизировать увод полнотекстовых описаний патентов США, начиная с 1976 года.
Именно по этой же причине, я, честно говоря, не очень “люблю” БД ФИПС. Лет 10 назад получить полнотекстовое описание патента у них можно было только за деньги. К настоящему моменту в информационно-поисковой системе ФИПС можно бесплатно выудить pdf-описания российских патентов, начиная с 2005 года. Что, в принципе, уже нормально, потому что средний срок “жизни” патента на изобретение – лет семь. Всё, что “старше”, как правило, уже теряет свою техническую актуальность.
Cегодня я предлагаю вам “Уловку № 10 компьютерной крысы”, позволяющую автоматизировать загрузку pdf-описаний патентов на изобретения из БД ФИПС. Итак, поехали!
Шаг 1. Скачиваем архивный файл “rupats.zip” (2 398 943 байт)
например, в папку “C:\FIPS”, и извлекаем туда содержимое архива.
Для мнительных аспирантов поясняю “кто есть who” из используемых Unix-утилит:
- cat.exe – утилита для последовательного объединения файлов,
- cut.exe – утилита для выделения полей или части строки в текстовом файле,
- ls.exe – утилита для формирования списка файлов и папок,
- paste.exe – утилита для объединения строк текстовых файлов,
- sed.exe – текстовый редактор (libiconv2.dll, libintl3.dll – необходимые dll-библиотеки),
- sort.exe – утилита сортировки строк текстового файла,
- tr.exe – утилита преобразования символов,
- wc.exe – утилита для подсчета строк, слов, знаков в текстовых файлах,
- wget.exe – утилита для загрузки файлов из сети.
Bat-файлы “1_mklist.bat”, “2_listdwnl.bat” и “pat1dwnl.bat” – самописные мной батники для поточной закачки pdf-описаний патентов РФ из базы данных ФИПС.
Внимание! На конец апреля 2017 год описания российских патентов в pdf-формате имеются в базе только для временного интервала 2005-2017 гг. Может быть, со временем господа из ФИПС “смилостивятся” и расширят диапазон. А пока – так.
Шаг 2. Открываем страницу “Информационно-поисковой системы” ФИПС.
Шаг 3. Тюкаем по пункту “Патентные документы РФ (рус.)”
Шаг 4. Отмечаем галочкой пункт “Рефераты российских изобретений”.
Шаг 5. Приступаем к поиску патентов, нажимая пункт меню “Поиск”.
Шаг 6. Вбиваем в строку “Название” моё любимое слово “радиолокатор” (ну, а вы можете вставить свои слова, по которым вы собрались искать патенты).
Шаг 7. Тюкаем по кнопке “Поиск”.
Шаг 8. Результат – найден 181 патент (02.05.2017).
Шаг 9. Открываем в папке “C:\FIPS” пустой текстовый файл “fipsdata.txt” и начинаем последовательно копировать (“Ctrl-A” “Ctrl-C”) содержимое страниц с результатами поиска и вставлять в файл “fipsdata.txt”.
Шаг 10. После того, как сформировали “fipsdata.txt”, то есть скопировали всё содержание четырёх html-страниц в данный файл, в папке “C:\FIPS” тюкаем два раза по батнику “1_mklist.bat”, предназначенному для автоматического “выковыривания” номеров найденных патентов на изобретения.
В результате, в этой папке появится непустой текстовый файл “patlist.txt” с сортированным по возрастанию списком 7-значных номеров патентов РФ.
ВНИМАНИЕ! После появления этого материала мои молодые коллеги обнаружили небольшой “косяк” при формировании списка номеров патентов на изобретения. Суть в том, что bat-файл “1_mklist.bat” был написан мной для случая копирования результатов поиска из браузера Firefox. Исправлению этой досадной мелочи посвящёна заметка от 15 мая “Дополнение к Уловке компьютерной крысы №10”.
Шаг 11. В папке “C:\FIPS” тюкаем два раза по файлу “2_listdwnl.bat”, который, собственно, и запускает процесс поточного увода pdf-описаний патентов из БД ФИПС.
Конечно, когда вам нужно “стырить” пару-тройку пэдээфников, вы легко сможете это сделать ручками. Но если речь идёт о “выдёргивании” пары сотен патентов, то, нужно помнить о том, что времени у аспирантов – не вагон, и тупо заниматься клацанием по ссылкам – это, по меньшей мере, нерационально.
Процесс пошёл. Ещё раз напоминаю, что патентов в pdf-формате до 2005 года в БД ФИПС не имеется, поэтому на начальном этапе смена номера патента будет происходить довольно быстро.
А вот и “тёпленькая пошла”. По мере закачки pdf-файлов, папка “pats” будет постепенно наполняться…
Пока не будет закачан последний в списке патент.
Чисто с информационной целью, в папку “errs” записываются номера тех патентов, у которых отсутствуют pdf-описания. Для ознакомления с этими патентами вам придётся лазить по базе данных и смотреть на их html-описания.
У меня на закачку 84 pdf-файлов (объёмом 49 735 565 байт) с описаниями российских патентов, извлечённых из базы данных по слову “радиолокатор” в названии, ушло минут 15. Заметим, без всякого моего участия.
В принципе, процесс закачки несложно распараллелить, дабы ускорить весь процесс. Но это актуально только для большого числа патентов. Так что я не стал заморачиваться.
Кроме того, в рамках данной процедуры выдёргиваются патенты РФ только с 2005 года по апрель 2017 (в данном случае крайним является Бюллетень № 13). Разбирающиеся в программировании аспиранты легко смогут модифицировать файл “pat1dwnl.bat” (а также добавить соответствующие файлы в папке “auxs”) с учётом дальнейшего пополнения БД ФИПС.
Вот и всё, господа аспиранты!
Благодарю вас за внимание, пишите посылки на мой адрес, а также свою диссертацию.
- Уловка компьютерной крысы № 9 (ссылка)
- Уловка компьютерной крысы № 8 (ссылка)
- Уловка компьютерной крысы № 7 (ссылка)
- Уловка компьютерной крысы № 6 (ссылка)
- Уловка компьютерной крысы № 5 (ссылка)
- Уловка компьютерной крысы № 4 (ссылка)
- Уловка компьютерной крысы № 3 (ссылка)
- Уловка компьютерной крысы № 2 (ссылка)
- Уловка компьютерной крысы № 1 (ссылка)