Уловка компьютерной крысы №10 ( Поточный увод патентов из БД ФИПС )

Уловка компьютерной крысы №10

Защитится ли аспирант-технарь, у которого в его личном “багаже” отсутствуют патенты (на изобретения, полезные модели) или свидетельства о регистрации программы для ЭВМ, БД, топологии интегральных микросхем?

А почему бы и нет? Вполне может проскочить. Ведь диссертация – это, в первую очередь, научная квалификационная работа. Хотя наличие документального подтверждения новизны разработанных в диссертации технических решений ещё никому не мешало на защите. В случае же отсутствия такового, аспиранту придётся заранее поломать свою голову, чтобы убедительно ответить на вопрос членов диссертационного совета: “А чем подтверждается новизна Вашего подхода?”.

Но в случае отсутствия патентов или свидетельств лично у вас (что возможно, но не есть “гуд”), отсутствие упоминания о запатентованных до вас технических решений в обзорной Главе – это, безусловно, полный “аллес капут!”. Поэтому, на мой взгляд, анализ патентов в диссертации на соискание степени кандидата технических наук – просто обязателен. А для этого нужно “шерстить” базы данных патентных ведомств.

Я терпеть не могу американцев, как природное явление, но “обожаю” базу данных Патентного ведомства США, поскольку её структура и организация данных позволяет почти полностью и “за без мани” автоматизировать увод полнотекстовых описаний патентов США, начиная с 1976 года.

Именно по этой же причине, я, честно говоря, не очень “люблю” БД ФИПС. Лет 10 назад получить полнотекстовое описание патента у них можно было только за деньги. К настоящему моменту в информационно-поисковой системе ФИПС можно бесплатно выудить pdf-описания российских патентов, начиная с 2005 года. Что, в принципе, уже нормально, потому что средний срок “жизни” патента на изобретение – лет семь. Всё, что “старше”, как правило, уже теряет свою техническую актуальность.

Читайте также:  Музейные бои и лекарство от печали

Cегодня я предлагаю вам “Уловку № 10 компьютерной крысы”, позволяющую автоматизировать загрузку pdf-описаний патентов на изобретения из БД ФИПС. Итак, поехали!

Уловка компьютерной крысы №10

Шаг 1. Скачиваем архивный файл “rupats.zip” (2 398 943 байт)

Скачать файл

например, в папку “C:\FIPS”, и извлекаем туда содержимое архива.

Для мнительных аспирантов поясняю “кто есть who” из используемых Unix-утилит:

  • cat.exe – утилита для последовательного объединения файлов,
  • cut.exe – утилита для выделения полей или части строки в текстовом файле,
  • ls.exe – утилита для формирования списка файлов и папок,
  • paste.exe – утилита для объединения строк текстовых файлов,
  • sed.exe – текстовый редактор (libiconv2.dll, libintl3.dll – необходимые dll-библиотеки),
  • sort.exe – утилита сортировки строк текстового файла,
  • tr.exe – утилита преобразования символов,
  • wc.exe – утилита для подсчета строк, слов, знаков в текстовых файлах,
  • wget.exe – утилита для загрузки файлов из сети.

Bat-файлы “1_mklist.bat”, “2_listdwnl.bat” и “pat1dwnl.bat” – самописные мной батники для поточной закачки pdf-описаний патентов РФ из базы данных ФИПС.

Внимание! На конец апреля 2017 год описания российских патентов в pdf-формате имеются в базе только для временного интервала 2005-2017 гг. Может быть, со временем господа из ФИПС “смилостивятся” и расширят диапазон. А пока – так.

Уловка компьютерной крысы №10Шаг 2. Открываем страницу “Информационно-поисковой системы” ФИПС.

Уловка компьютерной крысы №10Шаг 3. Тюкаем по пункту “Патентные документы РФ (рус.)”

Уловка компьютерной крысы №10Шаг 4. Отмечаем галочкой пункт “Рефераты российских изобретений”.

Уловка компьютерной крысы №10Шаг 5. Приступаем к поиску патентов, нажимая пункт меню “Поиск”.

Уловка компьютерной крысы №10

Шаг 6. Вбиваем в строку “Название” моё любимое слово “радиолокатор” (ну, а вы можете вставить свои слова, по которым вы собрались искать патенты).

Читайте также:  И опять по конец рук

Уловка компьютерной крысы №10Шаг 7. Тюкаем по кнопке “Поиск”.

Уловка компьютерной крысы №10Шаг 8. Результат – найден 181 патент (02.05.2017).

Уловка компьютерной крысы №10Шаг 9. Открываем в папке “C:\FIPS” пустой текстовый файл “fipsdata.txt” и начинаем последовательно копировать (“Ctrl-A” “Ctrl-C”) содержимое страниц с результатами поиска и вставлять в файл “fipsdata.txt”.

Уловка компьютерной крысы №10

 

Уловка компьютерной крысы №10

Уловка компьютерной крысы №10

Уловка компьютерной крысы №10

Уловка компьютерной крысы №10

Уловка компьютерной крысы №10Шаг 10. После того, как сформировали “fipsdata.txt”, то есть скопировали всё содержание четырёх html-страниц в данный файл, в папке “C:\FIPS” тюкаем два раза по батнику “1_mklist.bat”, предназначенному для автоматического “выковыривания” номеров найденных патентов на изобретения.

Уловка компьютерной крысы №10В результате, в этой папке появится непустой текстовый файл “patlist.txt” с сортированным по возрастанию списком 7-значных номеров патентов РФ.

Уловка компьютерной крысы №10

ВНИМАНИЕ! После появления этого материала мои молодые коллеги обнаружили небольшой “косяк” при формировании списка номеров патентов на изобретения. Суть в том, что bat-файл “1_mklist.bat” был написан мной для случая копирования результатов поиска из браузера Firefox. Исправлению этой досадной мелочи посвящёна заметка от 15 мая “Дополнение к Уловке компьютерной крысы №10”.

Шаг 11. В папке “C:\FIPS” тюкаем два раза по файлу “2_listdwnl.bat”, который, собственно, и запускает процесс поточного увода pdf-описаний патентов из БД ФИПС.

Конечно, когда вам нужно “стырить” пару-тройку пэдээфников, вы легко сможете это сделать ручками. Но если речь идёт о “выдёргивании” пары сотен патентов, то, нужно помнить о том, что времени у аспирантов – не вагон, и тупо заниматься клацанием по ссылкам – это, по меньшей мере, нерационально.

Уловка компьютерной крысы №10

Процесс пошёл. Ещё раз напоминаю, что патентов в pdf-формате до 2005 года в БД ФИПС не имеется, поэтому на начальном этапе смена номера патента будет происходить довольно быстро.

Читайте также:  Листая старые страницы

Уловка компьютерной крысы №10

А вот и “тёпленькая пошла”. По мере закачки pdf-файлов, папка “pats” будет постепенно наполняться…

Уловка компьютерной крысы №10Уловка компьютерной крысы №10

Пока не будет закачан последний в списке патент.

Уловка компьютерной крысы №10Чисто с информационной целью, в папку “errs” записываются номера тех патентов, у которых отсутствуют pdf-описания. Для ознакомления с этими патентами вам придётся лазить по базе данных и смотреть на их html-описания.

Уловка компьютерной крысы №10

У меня на закачку 84 pdf-файлов (объёмом 49 735 565 байт) с описаниями российских патентов, извлечённых из базы данных по слову “радиолокатор” в названии, ушло минут 15. Заметим, без всякого моего участия.

В принципе, процесс закачки несложно распараллелить, дабы ускорить весь процесс. Но это актуально только для большого числа патентов. Так что я не стал заморачиваться.

Кроме того, в рамках данной процедуры выдёргиваются патенты РФ только с 2005 года по апрель 2017 (в данном случае крайним является Бюллетень № 13). Разбирающиеся в программировании аспиранты легко смогут модифицировать файл “pat1dwnl.bat” (а также добавить соответствующие файлы в папке “auxs”) с учётом дальнейшего пополнения БД ФИПС.

Вот и всё, господа аспиранты!

Благодарю вас за внимание, пишите посылки на мой адрес, а также свою диссертацию.

Архив компьютерной крысы

  • Уловка компьютерной крысы № 9 (ссылка)
  • Уловка компьютерной крысы № 8 (ссылка)
  • Уловка компьютерной крысы № 7 (ссылка)
  • Уловка компьютерной крысы № 6 (ссылка)
  • Уловка компьютерной крысы № 5 (ссылка)
  • Уловка компьютерной крысы № 4 (ссылка)
  • Уловка компьютерной крысы № 3 (ссылка)
  • Уловка компьютерной крысы № 2 (ссылка)
  • Уловка компьютерной крысы № 1 (ссылка)
[свернуть]

Яндекс.Метрика