Поточный увод патентов из БД ФИПС ( Уловка компьютерной крысы №10 )

Защитится ли аспирант-технарь, у которого в его личном «багаже» отсутствуют патенты (на изобретения, полезные модели) или свидетельства о регистрации программы для ЭВМ, БД, топологии интегральных микросхем?

А почему бы и нет? Вполне может проскочить. Ведь диссертация — это, в первую очередь, научная квалификационная работа. Хотя наличие документального подтверждения новизны разработанных в диссертации технических решений ещё никому не мешало на защите. В случае же отсутствия такового, аспиранту придётся заранее поломать свою голову, чтобы убедительно ответить на вопрос членов диссертационного совета: «А чем подтверждается новизна Вашего подхода?».

Но в случае отсутствия патентов или свидетельств лично у вас (что возможно, но не есть «гуд»), отсутствие упоминания о запатентованных до вас технических решений в обзорной Главе — это, безусловно, полный «аллес капут!». Поэтому, на мой взгляд, анализ патентов в диссертации на соискание степени кандидата технических наук — просто обязателен. А для этого нужно «шерстить» базы данных патентных ведомств.

Я терпеть не могу американцев, как природное явление, но «обожаю» базу данных Патентного ведомства США, поскольку её структура и организация данных позволяет почти полностью и «за без мани» автоматизировать увод полнотекстовых описаний патентов США, начиная с 1976 года.

Именно по этой же причине, я, честно говоря, не очень «люблю» БД ФИПС. Лет 10 назад получить полнотекстовое описание патента у них можно было только за деньги. К настоящему моменту в информационно-поисковой системе ФИПС можно бесплатно выудить pdf-описания российских патентов, начиная с 2005 года. Что, в принципе, уже нормально, потому что средний срок «жизни» патента на изобретение — лет семь. Всё, что «старше», как правило, уже теряет свою техническую актуальность.

Cегодня я предлагаю вам «Уловку № 10 компьютерной крысы», позволяющую автоматизировать загрузку pdf-описаний патентов на изобретения из БД ФИПС. Итак, поехали!

Шаг 1. Скачиваем архивный файл «rupats.zip» (2 398 943 байт)

Скачать файл

например, в папку «C:\FIPS», и извлекаем туда содержимое архива.

Для мнительных аспирантов поясняю «кто есть who» из используемых Unix-утилит:

  • cat.exe — утилита для последовательного объединения файлов,
  • cut.exe — утилита для выделения полей или части строки в текстовом файле,
  • ls.exe — утилита для формирования списка файлов и папок,
  • paste.exe — утилита для объединения строк текстовых файлов,
  • sed.exe — текстовый редактор (libiconv2.dll, libintl3.dll — необходимые dll-библиотеки),
  • sort.exe — утилита сортировки строк текстового файла,
  • tr.exe — утилита преобразования символов,
  • wc.exe — утилита для подсчета строк, слов, знаков в текстовых файлах,
  • wget.exe — утилита для загрузки файлов из сети.

Bat-файлы «1_mklist.bat», «2_listdwnl.bat» и «pat1dwnl.bat» — самописные мной батники для поточной закачки pdf-описаний патентов РФ из базы данных ФИПС.

Внимание! На конец апреля 2017 год описания российских патентов в pdf-формате имеются в базе только для временного интервала 2005-2017 гг. Может быть, со временем господа из ФИПС «смилостивятся» и расширят диапазон. А пока — так.

Шаг 2. Открываем страницу «Информационно-поисковой системы» ФИПС.

Шаг 3. Тюкаем по пункту «Патентные документы РФ (рус.)»

Шаг 4. Отмечаем галочкой пункт «Рефераты российских изобретений».

Шаг 5. Приступаем к поиску патентов, нажимая пункт меню «Поиск».

Шаг 6. Вбиваем в строку «Название» моё любимое слово «радиолокатор» (ну, а вы можете вставить свои слова, по которым вы собрались искать патенты).

Шаг 7. Тюкаем по кнопке «Поиск».

Шаг 8. Результат — найден 181 патент (02.05.2017).

Шаг 9. Открываем в папке «C:\FIPS» пустой текстовый файл «fipsdata.txt» и начинаем последовательно копировать («Ctrl-A» «Ctrl-C») содержимое страниц с результатами поиска и вставлять в файл «fipsdata.txt».

 

Шаг 10. После того, как сформировали «fipsdata.txt», то есть скопировали всё содержание четырёх html-страниц в данный файл, в папке «C:\FIPS» тюкаем два раза по батнику «1_mklist.bat», предназначенному для автоматического «выковыривания» номеров найденных патентов на изобретения.

В результате, в этой папке появится непустой текстовый файл «patlist.txt» с сортированным по возрастанию списком 7-значных номеров патентов РФ.

ВНИМАНИЕ! После появления этого материала мои молодые коллеги обнаружили небольшой «косяк» при формировании списка номеров патентов на изобретения. Суть в том, что bat-файл «1_mklist.bat» был написан мной для случая копирования результатов поиска из браузера Firefox. Исправлению этой досадной мелочи посвящёна заметка от 15 мая «Дополнение к Уловке компьютерной крысы №10».

Шаг 11. В папке «C:\FIPS» тюкаем два раза по файлу «2_listdwnl.bat», который, собственно, и запускает процесс поточного увода pdf-описаний патентов из БД ФИПС.

Конечно, когда вам нужно «стырить» пару-тройку пэдээфников, вы легко сможете это сделать ручками. Но если речь идёт о «выдёргивании» пары сотен патентов, то, нужно помнить о том, что времени у аспирантов — не вагон, и тупо заниматься клацанием по ссылкам — это, по меньшей мере, нерационально.

Процесс пошёл. Ещё раз напоминаю, что патентов в pdf-формате до 2005 года в БД ФИПС не имеется, поэтому на начальном этапе смена номера патента будет происходить довольно быстро.

А вот и «тёпленькая пошла». По мере закачки pdf-файлов, папка «pats» будет постепенно наполняться…

Пока не будет закачан последний в списке патент.

Чисто с информационной целью, в папку «errs» записываются номера тех патентов, у которых отсутствуют pdf-описания. Для ознакомления с этими патентами вам придётся лазить по базе данных и смотреть на их html-описания.

У меня на закачку 84 pdf-файлов (объёмом 49 735 565 байт) с описаниями российских патентов, извлечённых из базы данных по слову «радиолокатор» в названии, ушло минут 15. Заметим, без всякого моего участия.

В принципе, процесс закачки несложно распараллелить, дабы ускорить весь процесс. Но это актуально только для большого числа патентов. Так что я не стал заморачиваться.

Кроме того, в рамках данной процедуры выдёргиваются патенты РФ только с 2005 года по апрель 2017 (в данном случае крайним является Бюллетень № 13). Разбирающиеся в программировании аспиранты легко смогут модифицировать файл «pat1dwnl.bat» (а также добавить соответствующие файлы в папке «auxs») с учётом дальнейшего пополнения БД ФИПС.

Вот и всё, господа аспиранты!

Благодарю вас за внимание, пишите посылки на мой адрес, а также свою диссертацию.

Архив компьютерной крысы

  • Уловка компьютерной крысы № 9 (ссылка)
  • Уловка компьютерной крысы № 8 (ссылка)
  • Уловка компьютерной крысы № 7 (ссылка)
  • Уловка компьютерной крысы № 6 (ссылка)
  • Уловка компьютерной крысы № 5 (ссылка)
  • Уловка компьютерной крысы № 4 (ссылка)
  • Уловка компьютерной крысы № 3 (ссылка)
  • Уловка компьютерной крысы № 2 (ссылка)
  • Уловка компьютерной крысы № 1 (ссылка)
[свернуть]