Поиск информации в Интернете/Поиск в базах данных

Поиск информации в базах данныхПравить

Процедура поиска является одной из центральных процедур в системах автоматической обработки информации. При решении любой задачи требуется выбирать исходные данные из некоторых заранее подготовленных массивов информации и записывать результаты решения в эти или другие массивы. Наиболее рациональным подходом к организации массивов информации при решении вычислительных задач является концепция банков и баз данных. Проблемы поиска информации в формализованных базах данных заслуживают самого серьезного внимания. Поиск информации в базах данных – это процесс отбора из них множества описаний объектов, удовлетворяющих сформулированным в запросе условиям. При этом в качестве результатов поиска могут выдаваться не все признаки объектов, а только часть их – в соответствии с условиями запроса. Объект может выбираться из массива по значению одного идентифицирующего его (ключевого) признака или по сочетанию значений нескольких ключевых признаков. Он может также выбираться по сочетанию любых других (неключевых) признаков, если это сочетание однозначно выделяет его из множества всех объектов массива.

Признаки объектовПравить

Первичные признаки назначаются при первоначальном описании объектов, а производные являются функциями первичных. Поиск может вестись как по первичным, так и по производным признакам. Чаще всего в процессе поиска информации выбирается не один объект, а множество объектов. Оно может быть задано различными способами: 1) перечнем значений ключевых признаков или сочетаний ключевых признаков; 2) значением или интервалом (перечнем) значений одного неключевого признака; 3) булевой функцией значений или интервалов (перечней) значений любых признаков объекта (как ключевых, так и неключевых); 4) отношением между признаками, выраженным с помощью арифметических и логических операции (операций типа “И”, “ИЛИ”, “НЕ”), а также отношений =, >, < и их отрицаний. Условия выборки признаков у найденных объектов задаются в виде перечней наименований этих признаков. Важной проблемой, возникающей при реализации процедур поиска информации, является проблема отождествления признаков объектов и установления парадигматических отношений между ними (отношений типа род-вид, целое-часть и др.). Общее решение этой проблемы связано с возможностью распознавания смыслового тождества и парадигматических отношений различных форм наименований понятий на основе их морфологического, синтаксического и семантического анализа. Но на практике широко применяются и другие решения, основанные на унификации форм представления наименований понятий в базах данных и использования систем меню, в которых пользователю предлагается делать выбор наименований понятий только из числа рекомендованных.

Три основных способа организации процесса выполнения запросов:Править

композиция запросов – запросы выполняются в строго определенной последовательности, а результаты поиска по предыдущему запросу используются в качестве исходных данных для формирования следующего за ним запроса. При этом первый запрос в серии запросов определяется полностью, а остальные – не полностью и доопределяются в процессе поиска.

объединение запросов – когда результаты поиска по нескольким запросам объединяются в одну общую выдачу.

разветвление запросов – когда после выполнения очередного запроса есть возможность перехода к одному из нескольких запросов в зависимости от выполнения тех или иных условий. Перечисленные способы организации процесса выполнения запросов могут применяться в различных сочетаниях, что позволяет строить различные процедуры многошагового поиска.

В числе наиболее популярных баз данных, доступных в онлайновом режиме, особого внимания заслуживают «LexisNexis» и «Интегрум» , так как фактически являются гипертекстовыми, аккумулируя документы различного типа, включая в себя массивы других баз данных, в том числе и не имеющих электронных версий вне «LexisNexis» или «Интегрум».

ИнтегрумПравить

«Интегрум» — российское информационно-аналитическое агентство, открытое в 1996 году. Назначение агентства — обеспечивать необходимой информацией компании, государственные учреждения, учебно-исследовательские организации. Медиабанк «Интегрума» содержит более 500 000 000 оцифрованных материалов из 10000 источников: федеральных и региональных изданий, радиостанций, телеканалов, сайтов, библиотек и баз данных. Получить доступ к любому материалу можно через сайт http://www.integrum.ru/ . Для этого надо выбрать услугу и подписаться.

Услуги для компаний и госучрежденийПравить

  • Поиск в СМИ.
  • Поиск компаний.
  • Мониторинг СМИ.
  • Бизнес-аналитика.

Услуги для учебных и исследовательских организацийПравить

Для исследователей и учащихся «Интегрум» это крупнейшая база данных русскоязычных источников. Не только современной прессы, но и полных текстов классической литературы, материалов фондов Агропрома, ИНИОНа, Роспатента, РГАЛИ, ГПНТБ. Работа с источниками максимально упрощена благодаря уникальной поисковой системе «Интегрума», учитывающей морфологию русского языка. На доступ к базе для некоммерческих организаций действуют скидки.

LexisNexisПравить

LexisNexis является ведущим мировым провайдером контента, предлагающий услуги для юридических и бухгалтерских фирм, корпораций, правительств, правоохранительных органов, научных учреждений.

СсылкиПравить