Новые возможности нечеткого поиска в БД товарных знаков и НМПТ

 



С октября 2017 года в интернет ИПС ФИПС появились новые возможности нечеткого поиска.

 

Сформированная в результате проведения запроса выдача теперь включает большее количество ранжированных документов с учетом различных расширений слов запроса.


Появилась возможность управлять  «уровнем соответствия запросу».


  • При указании уровня соответствия запросу «1» в выдачу попадет максимальное количество  документов с учетом применения всех возможных фильтров расширения запроса и параметра для редакционного расстояния 2.
  • При указании уровня соответствия запросу «2» в выдачу попадут  документы с учетом применения всех возможных фильтров расширения запроса и параметра для редакционного расстояния 1.
  • При указании уровня соответствия запросу «3» в выдачу попадут документы с учетом применения всех возможных фильтров расширения запроса без учета редакционного расстояния.

Фильтры расширения запроса призваны обеспечить создание различных вариантов слов исходного запроса, обеспечивающих получение  результатов (в том числе) сходных до степени смешения.

 

К фильтрам расширения относятся:

  • слияние – для примера, по запросу «глав продукт»  будут также найдены документы, содержащие слово «главпродукт»
  • разделение – для примера, по запросу «спортмастергипер» будут также найдены документы, содержащие слова «спортмастер гипер»
  • транслитерация (EN-RU, RU-EN) без учета фонетики – для примера, по запросу «glavproduct» будут также найдены документы, содержащие слово «главпродукт», соответственно по запросу «главпродукт» будут также найдены документы, содержащие слово «glavproduct»
  • морфология – в запрос будут включены все варианты слова, полученные в результате морфологического разбора
  • цифра в текст - для примера, по запросу «365» будут также найдены документы, содержащие слова «триста шестьдесят пять»

 

Редакционное расстояние, или расстояние Левенштейна — метрика, позволяющая определить «схожесть» двух строк — минимальное количество операций вставки одного (или более) символа, удаления одного (или более) символа и замены одного (или более) символа на другой, необходимых для превращения одной строки в другую.



Библиотека документов Нормативно-правовые акты
Библиотека загрузок Библиотека загрузок



© 2009 -   ФИПС