5.04 |
"СБДП и СБДР"
"Вас много, а я одна"
(безымянная советская продавщица)
Информационная услуга по формированию специализированных информационных баз данных (патентов и рефератов) предоставляется пока ТОЛЬКО для аспирантов и магистрантов технических специальностей прославленного Томского государственного университета систем управления и радиоэлектроники. По запросу могут быть сформированы следующие информационные массивы:
- специализированные БД полнотекстовых описаний патентов (СБДП) Патентного ведомства США,
- специализированные БД рефератов (СБДР) публикаций электронной библиотеки IEEEXplore.
"Заявки на обслуживание" аспирантов (магистрантов), независимо от пола и вероисповедания, принимаются: через Отделение послевузовского профессионального образования, по звонку "сверху", т.е. от уважаемого научного руководителя, по "блату", и, если "горит", то по контактному e-mail.
Формы предоставления ПАТЕНТНОЙ информации
- "вариант-1" (простейший): полнотекстовые описания патентов США в html-формате "россыпью";
- "вариант-2" (простой): БД патентов в xls-формате (14 полей);
- "вариант-3" (средней тяжести): полнотекстовые описания патентов США в html-, pdf- и tif-формате "россыпью";
- "вариант-4" (продвинутый): полнотекстовые описания патентов США в html-, pdf- и tif-формате, оформленные в оболочку с опциями навигации, выбора и поиска, плюс БД в xls-формате.
Формы предоставления РЕФЕРАТИВНОЙ информации
- "вариант-1" (простейший): база данных рефератов публикаций "IEEEXplore" в xls-формате;
- "вариант-2" (простой): база данных рефератов публикаций "IEEEXplore" в xls- и html-форматах;
- "вариант-3" (продвинутый): то же, что и "вариант 2", плюс опция поиска и выделения заданных словосочетаний.
"Бонусы"
- упорядоченный по убыванию частотный список, составленный по названиям патентов (публикаций);
- упорядоченный по алфавиту список устойчивых словосочетаний, составленный по названиям патентов (публикаций) – для иттерационного режима формирования СБДР.
Об ограничениях отпуска информационных продуктов в одни руки
- число подклассов МПК: не более 5;
- число устойчивых словосочетаний: не более 10;
- поиск патентов по ключевым словам в названии и/или реферате;
- число патентов США – не более 100 штук по одному подклассу МПК в одни руки;
- число рефератов "IEEEXplore" – не более 500 штук по одному словосочетанию в одни руки.
Порядок формирования и выдачи продукта
- комплектуется в порядке живой очереди (выкрики "Вы здесь не стояли" не приветствуются);
- формируется при наличии у меня свободного от работы времени;
- выдается на руки аспиранту в ПИО, как физическому телу, с тщательным анализом его глаз ("горят-не горят"), и произнесением краткого нравоучения о всемирно-историческом значении аспирантуры и необходимости защититься во чтобы-то ни стало.
Вниманию аспирантов (магистрантов)!
(голосом Глеба Георгиевича Жеглова)
Граждане обучающиеся! Не забываем, что качество изготовленной интеллектуальной продукции, как и колбасы, на 80% зависит от исходного сырья, т.е. от сформулированных критериев поиска. Для формирования СБДП и СБДР необходимо задать:
- устойчивые словосочетания на английском языке, уже существующие в английской литературе (например, "polarimetric SAR"), а не выдуманные аспирантом из своей головы;
- разумную глубину поиска (как правило 5 лет, т.е., например, 2005-2010), а не 1887-1950;
- для СБДП дополнительно требуется конкретный подкласс МПК (например, "G01S13/02" для "радиолокационных систем") и "район поиска" – в названиях и/или в рефератах.
Типичные ошибки при формулировании запроса!
- "Ошибка-1". Для поиска патентов США задано только одно ключевое (родовое) слово "radar" без указания места, где искать: в "названии" и/или "реферате"?
- "Ошибка-2". Для поиска патентов США не указан подкласс МПК, или он задан в слишком общем виде, например, "G01S".
- "Ошибка-3". Для поиска патентов США не указана глубина (интервал) поиска. Год, три, пять, – сколько?
В этих случаях в БД USPTO могут быть найдены десятки тысяч патентов. Так, по ключевому слову "radar" 1 июля 2010 г. найдено 35283 американских патентов, начиная с 1976 г.
- "Ошибка-4". Для поиска рефератов "IEEEXplore" задано только одно ключевое слово "radar". В этом случае в БД "IEEEXplore" найдено по релевантности 14547 статей в журналах и 35243 публикаций в трудах конференций (дата поиска 01.07.2010).
Обсчет
Произведем теперь нехитрые манипуляции с цифирками.
Будем считать,что средний объем кандидатской диссертации, состоящей из 3-4 глав, составляет примерно 200 страниц машинописного (А4) текста. Основную смысловую нагрузку, а стало быть и объем, несут 2-ая и последующие главы. Я, лично, не встречал кандидатских диссертаций, в которых обзорная часть, то бишь 1-ая глава, была бы больше 40 страниц. "Помножаем" 40 на 1800 (среднее число знаков с пробелами на одном м.п. листе). Получаем 72000 печатных знаков. Эмпирически выведено среднее количество символов в русском слове с учетом одного пробела после него – "9". Стало быть на 40 страницах "кирпича" уместится примерно 8000 наших цензурных слов.
Допустим еще одно полуфантастическое предположение: весь обзор основан на англоязычном материале, чего в жизни, конечно же, не бывает. Но, пусть будет. Существует опять же установленный эмпирическим путем пересчетный коэффициент перевода английского текста в русский: "1.2". По-видимому, русские люди более многословные. Таким образом, 8000 наших слов превращаются примерно в 6700 английских.
В выделенном поле "Реферат" (Пример 2) текст содержит 53090 буржуйских слов. То есть, выкинув из этого массива почти 9/10 объема информации, вы уже почти полностью закрываете потребности 1-ой главы своей диссертации. И это – только рефераты журнальных статей! А, ведь еще есть публикации на конференциях IEEE! А патенты? А книжки? А статьи любимого научного руководителя? ...
Так, что всплывает другая, не менее сложная, проблема – что делать с этим объемом информации, и как это все выкинуть из диссертации! Но эту проблему должен будет решать уже сам аспирант (магистрант), а не я. Убедительно?
Приведу только два примера готовых специализированных баз данных.
Пример 1
Специализированная база данных полнотекстовых описаний патентов США
Сформирована в 2009 г. по следующему запросу:
- подкласс МПК: "G02F1/00" ("Устройства или приспособления для управления интенсивностью, цветом, фазой, поляризацией или направлением света, ...");
- глубина поиска: 1980-2009 гг.
- ключевые слова в названиях патентов: "dark", "device", "devices", "induced", "ion-implanted", "lithium", "niobate", "optical", "photonic", "planar", "soliton", "solitons", "spatial", "switch", "switches", "using", "waveguide", "waveguides".
Для запуска СБДП разархивируйте файл в какую-нибудь папку, и щёлкните по exe-шнику "autorun.exe" в "корне" или откройте "index.html" в папке "CD\G02F01_00". И будет вам счастье... Внимание! Для сокращения объема, "живыми" в БД оставлены только первые 5 файлов (html, pdf, zip(tif)).
Если "зацепило", то смотрим "Инструкцию по применению" и качаем архивный файл (11.3 МБ)
Пример 2
Специализированная база данных рефератов статей в журналах IEEE
Сформирована в 2010 г. по следующему запросу:
- глубина поиска: 1994-2010 гг.
- ключевые слова в названиях статей: optical waveguide
Количество полей в БД: 10 ("Название", "Авторы", "Реферат", "Место работы авторов", "Издание", "Дата опубликования", "Том", "Страницы", "ISSN", "ISBN").
Краткая, и не вполне, наверное, нужная "Инструкция" – здесь, а архивный файл (167 кБ) – здесь.
Засим, почтеннейшая публика, разрешите откланяться!
© 2009, 2010. В.И. Карнышев
ОГЛАВЛЕНИЕ Следующий раздел Переход в подраздел
"Аспирантура: непутёвые заметки язвительного пессимиста"
© Патинформбюро,
, 2014