Cтраница 1
Оптимальное индексирование документов и информационных запросов обеспечивается при использовании специальных словарей-справочников, называемых тезаурусами ( греч. Такие словари-справочники позволяют легко осуществлять контроль за единообразным использованием ключевых слов на всех этапах работы ИПС: при индексировании, при вводе документов в ИПС, при формулировании поисковых предписаний и при проведении информационного поиска. [1]
Система индексирования документов и фактов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска. [2]
Система индексирования документов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации более точного поиска информации. [3]
Метод индексирования документов, при котором поисковый образ документа состоит из двух или более лексических единиц. [4]
Под индексированием документов понимается описание их содержания средствами ИПЯ. [5]
При индексировании документов в тезаурус не были представлены кандидатами синонимы, а иногда и дескрипторы, необходимые для отображения содержания документа. [6]
Структура процесса ввода запросов и алгоритмическая схема поиска информации в системе ОРДИНАТА. [7] |
Затем производится индексирование документов и запросов. [8]
Предметизатор, производящий индексирование документа, переносит регистрационный номер этого документа в специальный формуляр, в котором он записывает также поисковый обзор данного документа. Заполненный формуляр передается оператору, который с помощью флексорайтера пробивает содержимое этого формуляра на перфоленте. Поскольку флексорайтер одновременно воспроизводит кодируемый текст в печатном виде, то оператор визуально контролирует правильность записи. Далее перфолента с номерами документов и их поисковыми образами подается в вводное устройство микрофильмирующей установки. Туда же поступают оригиналы вводимых в ИПС Minicard документов. Оператор микрофильмирующей установки сравнивает регистрационный номер поступившего на съемку документа с номером документа, поисковый образ которого введен в установку. Выше уже указывалось, что в микрофильмирующей установке типа CD3A этот номер в дешифрованном виде высвечивается на специальном контрольном экране. [9]
Информационно-поисковые тезаурусы используются при индексировании документов и запросов. [10]
Исходной точкой предметизатора при индексировании документа служит заглавный дескриптор, который расположен в центре круговой схемы соответствующего класса дескрипторов. От этого дескриптора предметизатор следует в направлении родовидовых стрелок до тех пор, пока не найдет нужный ему специфичный дескриптор. При этом предметизатор должен включить в поисковый образ индексируемого документа все дескрипторы, которые он встречает в данной схеме на пути следования к искомому дескриптору. [11]
В некоторых случаях, когда индексирование документов производится сугубо содержательным образом, индексирующее отображение Г в рамках формального описания ИПС придется считать первичным, нерасчленимым объектом. [12]
Использование тех или иных слов для индексирования документов определяется Списками ключевых слов [9], задающими также и форму их представления. [13]
Изложенное показывает, насколько привлекательно выглядит автоматизация индексирования документов, которая в то же времы сохраняет все возможности ИПЯ Нефть-2, Конечно, реализация автоматического индексирования ( АИ) может повлечь за собой некоторое ухудшение поисковых характеристик системы. Однако прагматика информационного поиска, подразумевающая создание не идеальной ИПС, а лишь такой системы, которая имела бы удовлетворительные характеристики с точки зрения абонента системы при минимуме затрат труда на ее эксплуатацию, делает проблему разработки системы АИ весьма актуальной. [14]
В основу дескрипторных языков положена следующая сущность метода индексирования документов. Предмет каждого документа или другого элемента информации характеризуется или описывается с помощью некоторого множества дескрипторов, взятых из формального словаря терминов. [15]