Научно-производственный центр Интелтек Плюс

ПОЛНОТЕКСТОВАЯ ДОКУМЕНТАЛЬНАЯ
ИНФОРМАЦИОННАЯ СИСТЕМА

“ODB-TEXT”
ВЕРСИИ 3.0

А.М.Андреев, Д.В.Березкин, Ю.А.Кантонистов

Компания НПЦ “ИНТЕЛТЕК ПЛЮС” (Москва), тел. (095) 177-53-11

Внедрение компьютерных технологий в производство и управление предприятиями становится все более насущной задачей. Информационная революция - объективная реальность наших дней. Газеты и журналы заводят электронные офисы и распространяются по компьютерным сетям. Биржевые операции, банковские платежи, коммерческие предложения - обычные явления в компьютерных информационных каналах. В буквальном смысле компьютеризацию можно “ощутить”, изучая каталоги программных продуктов, предназначенных для использования для автоматизации современного предприятия.

Система “ODB-Text” версии 3.0 - средство коллективной обработки документов и ведения корпоративного архива. В числе возможных приложений можно назвать автоматизацию учета документооборота современного офиса, построение справочно-информационных систем (подобных известным юридическим базам данных), ведение сетевых баз данных, учет кадров, библиографию. Используя “ODB-Text”, Вы можете вести архив самых различных документов, будь то договоры, письма, новости и т. д., доступный как из локальной сети так и пользователям глобальных сетей. В архиве можно хранить огромное количество различных данных. Система предоставляет разнообразные средства для поиска и доступа к документам в базе данных (далее - просто БД). Например, пользователь сможет найти документ, содержание которого помнит смутно, воспользовавшись полнотекстовым поиском. Древовидный каталог-рубрикатор позволяет ему систематизировать и упорядочить документы. Для автоматизации обработки документов в систему встроен специализированный текстовый редактор, который, наряду со стандартными функциями, обеспечивает механизм добавления в документ ссылок, смысловых понятий и т.д. Возможно добавлять в текст документа иллюстрации, таблицы, графики, отчеты, в общем, любые объекты Windows-программ. В системе “ODB-Text” реализована поддержка коллективной обработки документов. Несколько пользователей могут в один момент работать с одним и тем же документом, причем, каждый человек будет оперативно оповещаться об изменениях, внесенных остальными.

Объектно-ориентированная система ODB-Text версии 3.0 - оригинальная разработка научно-производственного центра “Интелтек Плюс” - это корпоративное хранилище документов, доступ к которому возможен из локальных сетей Windows, Windows NT, Novell, глобальных сетей по протоколу TCP/IP, в том числе из сети Интернет. ODB-Text существенно облегчает упорядочение и поиск информации в корпоративной сети Вашего предприятия, имеет средства построения отчетов.

ODB-Text позволяет эффективно решать ряд проблем, возникающих на современном предприятии:

  • Аналитическая обработка данных с целью получения информации, которую можно использовать для принятия решений. Программный комплекс ODB-Text обладает мощными поисковыми возможностями. Вы можете найти документы, удовлетворяющие целому ряду критериев. Наиболее интересная возможность – поиск по содержанию документа, причем по запросам на естественном языке. В новой версии добавлена функция построения отчетов. Например, если требуются выборки данных по определенным критериям: все нормативные акты, посвященные налогам на добавленную стоимость, система ODB-Text сформирует файл отчета по результату поискового запроса. Далее пользователь может импортировать файл отчета в программу электронных таблиц, например Microsoft Excel и проделать статистические расчеты, построить диаграммы, отражающие явление, над анализом которого работает эксперт.
  • Интеграция данных различных форматов и различных программных продуктов. Поддерживаются данные следующих форматов: текстовые файлы в кодировке DOS, Windows, документы Microsoft Word, Microsoft Excel, Microsoft PowerPoint, в формате HTML ( кодировки DOS, Windows, KOI-8 ). Поддерживаются также все форматы, для которых имеется соответствующий OLE-сервер. Это означает, что документы популярных программ Autocad, CorelDRAW, а также рисунки, звуковые фрагменты, а также видео могут быть частью базы документов ODB-Text.
  • Доступ к информации из любого места – из локальной сети, посредством удаленного подключения к серверу базы данных, наконец, из сети Интернет. Сетевая подсистема программного комплекса ODB-Text опирается на протокол обмена данными TCP/IP, доказавший свою эффективность и перспективность. Это означает, что клиенты ODB-Text могут получить доступ к документам корпоративного хранилища из любой точки: из локальной сети предприятия, посредством удаленного подключения к корпоративной сети, из любой точки глобальной сети Интернет. Более того, пользователи получают доступ к базе документов, имея в своем распоряжении только броузер – Nescape Navigator 4.0 или Internet Explorer 4.0. Конечно, предварительно администратор должен разрешить доступ к документам пользователю Интернет.
  • Надежная защита корпоративной информации. Защита в системе ODB-Text обеспечивается работой сервера базы документов в среде Windows NT, возможностью разделения доступа у документам базы, а также, при необходимости, Интернет-пользователи могут воспользоваться средствами защиты данных, пересылаемых от броузера к серверу, например SSL ( Security Sockets Layer ). В начале сеанса работы пользователь вводит свое имя и пароль, по которым определяется перечень документов, к которым пользователям разрешен доступ. Разделение доступа возможно и по операциям с документами. Например, большая часть пользователей имеет возможность только просматривать, искать документы, операторы могут пополнять базу новыми документами, а администратор может отредактировать документ или удалить его.
  • Оперативное обновление информации, особенно когда она быстро изменяется. Сервер ODB-Text и Web-сервер ODB-Text могут работать совместно, обмениваясь информацией по заданному расписанию или по команде администратора. С помощью специальной конфигурационной утилиты администратор системы планирует время синхронизации баз, например, каждую пятницу или ежедневно в начале и в середине рабочего дня. Работа организации может быть организована таким образом, что небольшая часть сотрудников, освоивших клиентскую оболочку ODB-Text занимаются обновлением базы, в то время как большинство пользователей работают с документами через броузер.
  • Простота освоения и эксплуатации системы наряду с богатыми функциональными возможностями. Устанавливая сервер ODB-Text вы можете указать необходимость установки Web-сервера ODB-Text, который представляет собой расширение Microsoft Internet Information Server’а версии 2.0 или выше. Выгоды такого подхода для корпоративных пользователей очевидны: им нет нужды осваивать сложные интерфейсы, достаточно изучить броузер как универсальное средство поиска и просмотра документов. В то же время для администратора или квалифицированного пользователя предоставляется ряд дополнительных средств. Во-первых, это клиентская оболочка ODB-Text, где пользователь работает с документами базы: ищет, добавляет, редактирует, удаляет, готовит отчеты и т.д. Во-вторых, это Дизайнер форм – программа, с помощью которой администратор системы может создавать новые виды документов или модифицировать виды документов, поставляемых вместе на дистрибутиве, например, изменить набор реквизитов для договоров или платежных поручений.
  • Невысокие требования к аппаратным средствам. Систему ODB-Text, в том числе и сервер, можно установить на компьютере с процессором 80386 и объемом памяти всего 8 Мб! Для эффективной работы, конечно, желателоьно использовать более мощный компьютер в качестве сервера баз данных. С помощью ODB-Text Вы можете создать систему, отвечающую всем современным требованиям к корпоративной информационной системе и мультимедийным базам данных без существенных затрат на оборудование.

Основные компоненты системы “ODB-Text”

Система “ODB-Text” состоит из нескольких компонентов, среди которых наиболее важными являются Сервер и Программа-клиент.

Сервер

Как правило, устанавливается на мощном компьютере. Именно там на жестком диске присутствуют базы данных. За состоянием сервера следит Администратор сети. В его компетенции создание новых баз данных, изменение и удаление существующих. Именно на сервере происходит индексация документов, работает поисковая машина, которая находит документы по запросу на естественном языке, выполняется проверка привилегий пользователей.

Сервер системы “ODB-Text” выполняет следующие основные действия:

  • Добавить новый документ в базу данных;
  • Прочитать документа из БД;
  • Искать документы в БД;
  • Редактировать документ;
  • Удалить документ из БД;
  • Получить список ключевых слов по каждому из полей документа.

Программа-сервер предоставляет широкие возможности конфигурации баз данных и дополнительных вспомогательных функций. Администратор сети может:

  • Создать сетевую базу документов;
  • Указать права каждого пользователя по доступу к документам базы;
  • Задать расписание синхронизации с WEB-сервером ODB-Text или синхронизировать базы данных в ручном режиме;
  • Разрешить или запретить ведение протокола сетевого обмена с клиентами системы “ODB-Text”;
  • Задать файл для сохранения протокола;
  • Задать режим автоматического формирования имен баз данных;
  • Позволить системе самой выбирать каталог для дисковых файлов баз данных;
  • Указать каталог куда будут помещаться дисковые файлы баз данных.

Программа-клиент

Используется для доступа к базам данных на сервере. Это рабочий инструмент конечного пользователя системы - средство для поиска, просмотра, добавления, редактирования и печати документов. Программа-клиент устанавливается на рабочем месте сотрудника фирмы.

Начало сеанса работы с системой

Для работы с базой данных документов клиент указывает свое имя, пароль и, если нужно, сетевой адрес сервера. В большинстве случаев администратору достаточно один раз настроить параметры для пользователя. В дальнейшем пользователь сможет начать работу с базой без посторонней помощи.

Информация о пользователе направляется на сервер и далее пользователь должен выбрать с какой документальной базой он будет работать. Вместе с дистрибутивом поставляется набор баз “Офис”, “Библиотека”, “Кадровый учет”.

Можно запомнить имя, пароль пользователя, базу документов, с которой он работает и не вводить его всякий раз при входе в систему, следует установить опцию “Запомнить имя и пароль” и “Запомнить имя базы”. Помните, что в этом случае любой человек сможет подключиться к базе с Вашими правами доступа. Таким образом, запоминать имя и пароль следует только в том случае, если Вы уверены, что к Вашему компьютеру не имеют доступа посторонние.

После того как произошло подключение, пользователю становятся доступными документы, хранящиеся в базе данных. Сеанс связи с сервером длится до тех пор пока пользователь не отключится от базы или закроет программу-клиент. В течение сеанса клиент по сети отправляет на сервер запросы и ожидает ответ. Как только сервер обработает запрос, он посылает клиенту результат обработки. Это может быть результат поиска, то есть список найденных документов, или текст, на который есть ссылка из текущего документа, список ключевых слов для осуществления поиска и так далее.

Основные понятия системы “ODB-Text”

Документ - центральное понятие в системе “ODB-Text”.

Вообще систему “ODB-Text” можно назвать документоцентричной, так как ее основное назначение - работа с документами. Поэтому целесообразно ввести ряд определений, имеющих отношение к документам.

Реквизит - информация, которая извлекается из текста или дополняет его.

Два реквизита присутствуют в любом документе. Это идентификатор и название документа.

Идентификатор - строка, присвоенная документу, она должна быть уникальна для каждого документа.

Идентификатор присваивается докумету автоматически во время его создания.

Реквизит “Название документа” говорит сам за себя. Каких бы то ни было ограничений на строку названия не накладывается.

Поисковый реквизит - реквизит, в котором возможно ввести поисковый запрос.

Множественный реквизит - поле, имеющее несколько значений. В карточке реквизитов множественные поля помечены зеленым цветом.

Группа реквизитов - несколько реквизитов, объединенных по смыслу или иному критерию.

Тип реквизита - тип данных, которым представляется реквизит.

В системе “ODB-Text” поддерживаются основные типы данных: словосочетание с разбиением, словосочетание без разбиения, число целое, число вещественное, дата, время, номер телефона.

Документ (абстрактное понятие) - информационная единица, состоящая из обязательного раздела - смысловой части (текста), набора реквизитов, которые упрощают поиск, организацию и классификацию и необязательного - оглавления, списка понятий, ссылок на другие документы.

Тип документа - текст плюс фиксированный набор реквизитов, которому присвоено имя.

Image6.gif

Рис. 1. Документ в системе “ODB-Text”.

Экземпляр документа - документ конкретного типа с полностью или частично заполненными реквизитами.

Рассмотрим пример с документом типа “Входящий факс”. Тип документа “Входящий факс” может выглядеть так:

  • Название документа
  • Номер по порядку
  • Дата получения
  • Отправитель
  • Номер телефона отправителя
  • Тема

Допустим, что 20 июня 1996 года от компании “Commеrce Inc.” получен факс следующего содержания:

Убедительная просьба срочно выслать проект текста договора об аренде офисного помещения.

С уважением, Иван Иванов, менеджер.

Экземпляр документа после обработки показан в Таблице 1.

Таблица 1

Имя реквизита

Значение реквизита

Название документа

Факс с договором об аренде

Номер по порядку

100

Дата получения

20.06.96

Отправитель

“Commerce Inc”

Номер телефона отправителя

200-20-98

Тема

Аренда офиса

До занесения в базу документ и текст документа в общем случае идентичны. При добавлении программа-клиент попросит ввести два обязательных реквизита: название документа и идентификатор. В дальнейшем Вы можете выделить из текста документа реквизиты, которые Вы сочтете нужными для дальнейшей работы и занести их в соответствующие поля реквизитов.

Обработка документов в системе “ODB-Text”

Как уже упоминалось выше, документ в “ODB-Text” может содержать в себе понятия, оглавление и ссылки. Их наличие значительно облегчает повседневную работу с документами. Но сначала поясним, что означают эти термины.

Понятие - термин, присутствующий в тексте документа. Он может определяться в тексте документа или же просто упоминаться в нем.

Пример. Тип документов - Закон Российской Федерации. Экземпляр закона - “Об основах налоговой системы в Российской Федерации”. В тексте этого закона многократно встречается термин ”ПОДОХОДНЫЙ НАЛОГ”. Поэтому правильно будет рассматривать его как смысловое понятие.

Оглавление. Часто документы разделены на главы, разделы или пункты. Для ускорения перемещения по тексту (очень полезно в случае объемных документов) Вы можете составить оглавление документа и впоследствии, выбирая пункт оглавления, позиционироваться в нужное место в тексте.

Ссылка - место в тексте документа, связанное по смыслу или по какому-либо признаку с фрагментом этого же или иного документа.

Точка входа - место в тексте документа, на которое есть ссылка.

Пользователю предоставляется специализированный редактор текстов документов. Он наделен возможностью выделения понятий, оглавления, цветового оформления, установки гипертекстовых ссылок. Обработка документа существенно облегчает работу с ним в дальнейшем. Документ с оглавлением, понятиями, ссылками показан на Рис. 1.

Имеется возможность выгрузить текст документа из БД в дисковый файл.

Вы можете вставить в текст документа гипертекстовые ссылки на другие документы в БД. Таким образом можно сформировать мощный механизм навигации. Это особенно актуально для большой базы данных.

На Постановление 1 ссылается только на Закон 1, в то время как в тексте Постановления 2 есть ссылки на все три закона (см. Рис. 2.).

Ошибка! Источник ссылки не найден.

Рис. 2. Гипертекстовые ссылки.

В системе “ODB-Text” можно получить список ссылок в текущем документе. Например, для Постановления 2 получится такой список:

  • Закон 1
  • Закон 2
  • Закон 3.

Очень часто требуется получить список документов, которые ссылаются на текущий - список респондентов. Например, для Закона 1 список респондентов выглядит так:

  • Постановление 1
  • Постановление 2

Организация документов в базе данных

Если документы в БД никак не систематизированы, то пользы от такого хранилища будет немного. Вспомните, что в любом архиве или библиотеке чтобы найти и заказать интересующую Вас литературу Вы обращаетесь в каталог. Каталог - структурированное описание содержимого архива. Можно вспомнить несколько иной пример из той же области. Чтобы облегчить работу с книгой в ее тексте часто содержатся ссылки на другие книги и журналы, затрагивающие ту же тему. Чтобы ориентироваться в содержимом обязательно дается оглавление, глоссарий - список ключевых слов. В системе “ODB-Text” есть средства очень похожие на оглавление, сноски, глоссарий. Только они разработаны специально для организации хранения и быстрого поиска документов в базе данных.

Роль каталога или оглавления архива в системе “ODB-Text” играет рубрикатор - см. Рис. 3. Рубрикатор создан многоуровневым, то есть каждая рубрика может содержать в себе либо документы, либо другие подрубрики. Таким образом, пользователю предлагается возможность систематизировать документы и вести их учет. Упорядочение документов значительно ускоряет их поиск.

Image7.gif

Рис. 3. Рубрикатор в системе ODB-Text.

Спустившись по рубрикам до интересующего Вас раздела можно выбрать документ и просмотреть его текст. Полезный аспект - рубрикатор системы можно редактировать, настраивая в соответствии со своими потребностями. Находясь на любом уровне рубрикатора Вы можете создать новую рубрику, отредактировать или удалить уже существующую. Записи-документы также можно корректировать и удалять. Занести документы в рубрикатор Вы можете во время его просмотра, причем если он уже фигурирует в какой-либо рубрике, то система определит сей факт и перенесет Вас именно в эту рубрику.

Загрузка нового документа в базу данных

Как правило, база данных регулярно пополняется. Система “ODB-Text” предоставляет пользователю несколько вариантов занесения документов в базу данных. Можно выделить два основных способа.

Image8.gif Создание документа. В этом случае пользователю предлагается редактор, чтобы ввести текст документа и оформить его реквизиты. Название документа формируется автоматически и впоследствии его можно будет отредактировать. можно заполнить все или некоторые реквизиты, напечатать текст письма, сохранить его в дисковом файле, отправить по электронной почте или напечатать. Документ должен быть занесен в рубрикатор, при попытке закрыть документ пользователь получит предупреждение.

Image9.gif Загрузка документа из файла. Это целесообразно, если в БД заносятся документы, ранее набранные или преобразованные в электронное представление. Они могут печататься оператором или сниматься сканером, обрабатываться распознавателем текста и затем сохраняться в дисковом файле.

Документы многих программ Windows можно перенести в ODB-Text как объекты OLE. Это означает, что они будут выглядеть точно также как в “родной” программе плюс появится возможность полнотекстового поиска и к тому же они будут занимать на диске в 3-5 раз меньше места. Например, документ Word сохранит стили абзацев, размер и типы шрифтов, цветовое оформление, рисунки и все эффекты, использованные при оформлении текста документа.

В системе возможны разные способы формирования имени документа:

  1. “Автоматически” – при этом документам присваиваются имена, начинающиеся с названия типа, например, “Нормативный акт0000111”, “Письмо000008765” и т.п.;
  2. “Название по имени файла” - документу будет присвоено имя файла, из которого он загружался;
  3. “Название по первой строке документа” - имя документа берется из первой строки текста документа.

Объекты OLE могут помещаться в текст документа различным образом. Возможны следующие режиме загрузки:

  1. “Загружать объекты как внедренные” - документ OLE сохраняется непосредственно в базе документов, в дальнейшем любой пользователь сможет его прочитать, отредактировать, распечатать;
  2. “Загружать объекты как ссылки” - в базу данных загружаются только ссылки на документы OLE, размещенные в файлах. Полноценный доступ к документу получает только пользователь, на диске которого находится исходный файл.
  3. “Загружать только текст объектов” - в базу загружается только текст документов.

Доступ к загруженному в базу данных документу

Чаще всего при работе с базой данных документов требуется найти и просмотреть тот или иной документ. Если в базе находится архив в тысячи и десятки тысяч документов, то сделать это бывает нелегко. Для доступа к нужному Вам документу в системе “ODB-Text” предусмотрено несколько путей:

Рубрикатор. Упорядоченный древовидный рубрикатор позволяет, спустившись по разветвленным каталогам, найти раздел, который содержит нужный документ;

Поиск. Система “ODB-Text” обладает мощными поисковыми возможностями. Поиск ведется по каждому виду документа в отдельности. Например, Вы сможете найти либо телеграммы, либо платежные поручения. Программа-клиент прежде чем начинать поиск спросит у Вас о типе документа, который надо найти. Документ можно искать по реквизитам, по тексту и по понятиям, т. е. терминам, встречающимся в тексте документа. Причем, по тексту можно осуществить полнотекстовый поиск, вводя запрос на естественном языке.

Подробнее о естественноязыковых запросах мы остановимся ниже, здесь же поясним, что такие запросы используются, если Вы не помните точно ключевые слова, которые содержатся в тексте нужного документа. Поиск можно осуществлять одновременно и по реквизитам, и по тексту документа. В этом случае будут найдены документы, которые содержат ВСЕ ключевые слова, заданные при поиске. После поиска в программе появится новое окно с результатом поиска. Среди списка найденных документов можно выбрать нужный документ.

Поиск документов

Система “ODB-Text” позволяет искать документы по различным критериям. Поиск возможен по каждому реквизиту документа, по понятиям, размеченным в тексте документа и по содержанию документа. В последнем случае используется полнотекстовый поиск.

Поиск документа начинается с выбора типа документа, который надо найти. Таким образом, сперва необходимо определить, что нужно искать - договор, письмо или другой тип. При этом возможно установить опцию “Найти все документы этого типа” и тогда система выдаст список всех документов заданного типа.

Для того, чтобы поиск состоялся, должно быть заполнено хотя бы одно поле

При поиске по реквизитам вводится строка-запрос в одном или нескольких полях поисковой карточки. При формировании запроса для поиска по реквизитам можно воспользоваться списком ключевых значений любого из полей-реквизитов, кроме даты, времени и числа. Список ключевых значений представляет из себя набор всех значений для данного поля, имеющихся на текущий момент в базе данных. В ключевых словах используются только заглавные буквы.

Пользователю предоставляется возможность задавать слова не полностью, а лишь указывая основу слова, по которой должен производиться поиск. Окончание слова можно сделать несущественным (“замаскировать”) с помощью символа “*” (звездочка). Например, использование в запросе конструкции закон* будет трактоваться как поиск текста, содержащего слова закон, закона, законами, законе, законно, законном, законные, законным, законных, законов, законодательного, законодательной, законодательном, законодательные, законодательным, законодательных, законодательства, законодательстве, законодательство, законом, закону, законченные, законы и т.д.

Для целых чисел можно вводить запрос на точное соответствие, а также задавать отношения “больше” - >, “меньше” - <. Можно задать диапазон, в который должно укладываться число. Например: 123456789, >1200, <100, 2000-5000.

Для дат можно вводить запрос на точное соответствие, а также задавать отношения “больше”, “меньше”. Можно задать диапазон, в который должна попадать искомая дата. Например: 03.09.1997, >12.12.1990, <01.10.1997, 01.01.1995-01.01.1997.

Для данных типа “время” можно вводить запрос на точное соответствие, а также задавать отношения “больше”, “меньше”. Можно задать диапазон, в который должно попасть искомое время. Например: 01:01:00, >06.00.00, <02.35.00, 00.00.00-01.00.00 .

Для телефонов можно вводить запрос на точное соответствие, а также маскировать окончание номера звездочкой - в этом случае система найдет все документы, в которых номер телефона совпадает с поисковой строкой. Примеры: 177-8028, (095)177*.

Как показывает опыт, пользователи быстро схватывают суть формального поиска. Однако поисковые возможности системы “ODB-Text” этим не исчерпываются. Для более эффективного поиска пользователю предлагается несложный язык запросов. “ODB-Text” позволяет при формировании запроса разделять слова (или группы слов) пробелами или запятыми. Наличие пробела означает, что поиск будет по И (поиск документов, в которых есть и то, и то), запятой - что поиск идет по ИЛИ (поиск документов, в которых есть или то, или это). Приоритет И выше ИЛИ, поэтому для правильной интерпретации сложного запроса (группировки) нужно использовать круглые скобки. Примеры поисковых запросов и их интерпретации механизмом поиска БД - Таблица 2.

Таблица 2

Поисковый запрос

Результат поиска

Пошлина сбор

Документы, которые содержат И слово “пошлина”, И слово “сбор”

пошлина, сбор

Документы, которые содержат ИЛИ слово “пошлина”, ИЛИ слово “сбор”

пошлина сбор, закон

Документы, которые содержат ИЛИ слова “пошлина” И “сбор”, ИЛИ слово “закон”

пошлина (сбор, закон)

Документы, которые содержат ИЛИ слово “пошлина”, ИЛИ в тексте которых есть по крайней мере одно из слов “сбор” ИЛИ “закон”

Пошлина, (сбор закон)

Документы, которые содержат слово “пошлина” ИЛИ в тексте которых есть И слово “сбор”, И слово “закон”

Пошлина, (сбор, закон)

Пошлина, сбор, закон

Документы, которые содержат ИЛИ слово “пошлина” ИЛИ слово “сбор” ИЛИ слово “закон”

При поиске по тексту документа пользователю предоставляются дополнительные возможности создания запроса. Помимо всех возможностей формального запроса по реквизитам здесь можно задаваться расстоянием между словами в тексте. Этой цели служат символы “\” и “/” с числом между ними. Такой запрос определяет операцию И между группами слов и указывает максимально допустимое расстояние между ними в тексте документа.

Например, конструкция “закон\3/собственность” приводит к поиску документов, в тексте которых встречаются слова “закон” И “собственность”, разделенные не более чем тремя словами. В результате будут найдены, например, документы, содержащие такие фразы: “закон о собственности в РСФСР”, “понятие собственность определяется в законе”, “закон РСФСР, регулирующий собственность на землю”.

Порядок следования слов в запросе произвольный. Например, запросу “перерег*\6/мал*\6/предпр*” удовлетворяет фрагмент “малые предприятия, для которых не требуется перерегистрация”.

Возможность формулировки запросов на естественном языке - изюминка системы “ODB-Text”. По умолчанию запрос в тексте считается организованным в естественно-языковой форме (ЕЯФ).

Запрос на естественном языке может содержать:

слова в полной форме - например, Министерство финансов;

слова в сокращенной форме - например, мин. фин.; формальным признаком сокращения является точка в конце слова;

слова, состоящие из комбинации букв, цифр и специальных символов (в частности, числа) - например, 1-й заместитель.

Ограничения на запросы в естественноязыковой форме.

Не обрабатываются запросы, содержащие отрицания. Например, запрос “Порядок взимания всех налогов, кроме подоходного” может быть преобразован к виду “Взимание подоходного налога”.

Запрос на естественном языке относится ко всему тексту документа, а не к его отдельным реквизитам. Например, не будет понят запрос “Найти документы, в названиях которых говорится о защите авторских прав”, он будет обрабатываться как относящийся ко всему тексту документа.

Существует ряд символов, наличие которых в запросе, считающимся естественноязыковым, сразу переводит его в разряд формального. К таковым относятся “*”, “/”, “\”.

Желательно задавать слова не в сокращенной форме, а в полной, так как эффективность поиска выше за счет возможности определить часть речи. Также желательно использовать минимум незначащих (не информативных) слов (типа: хочу, интересно узнать и т.д.). Пример естественноязыкового запроса: “Все законодательство о защите авторских прав”.

Полнотекстовый поиск - очень мощный поисковый механизм. Соответственно, он поглощает ресурсы сервера значительно больше, чем поиск по реквизитам или формальный поиск по тексту.

Очень часто удобно запомнить поисковый запрос и его результат с тем чтобы в будущем не тратить драгоценное время на формулировку и уточнение поискового запроса. В системе можно сохранить результат поиска как документ ODB-Text, так же как и обычный документ, возможно поместить его в рубрикатор. При необходимости легко произвести поиск среди результатов поисковых запросов.

Интерфейс программы-клиента

Программа-клиент системы “ODB-Text” работает в среде Windows. Windows в переводе с английского означает “Окна”. Просмотр текста документа, реквизитов, понятий, результатов поиска осуществляется в отдельных окнах. Окна можно перемещать, изменять размеры, минимизировать, словом, располагать на экране как это наиболее удобно. Умелое использование многооконного интерфейса способно ускорить повседневную работу с документами. Более того, пользователь может изобрести новые приемы обработки служебных документов, принципиально невозможные в бумажном делопроизводстве.

Например, принятие важного решения наверняка потребует одновременного просмотра нескольких документов. В системе “ODB-Text” Вы сможете найти нужные бумаги, разместить их на экране монитора. Если потребуется, всегда можно просмотреть документы, на которые есть ссылки в текстах - см. Рис. 4.

Image10.gif

Рис. 4. Несколько документов различных типов в окне программы.

Таким образом, квалифицированный пользователь имеет в лице “ODB-Text” полезного советника.

Для удобства пользователя команды меню в программе-клиенте дублированы. К некоторым операциям возможен быстрый доступ через панель инструментов.

Изменение документа

Документы в системе “ODB-Text” - не монолиты. Их можно изменять. Просматривая документ, пользователь всегда имеете возможность включить режим редактирования.

Карточку реквизитов и текст документа можно редактировать независимо. Редактирование конкретного реквизита активизируется двойным щелчком мыши по нему. В дальнейшем мы будем пользоваться двумя терминами:

  • захват поля - попытка редактирования поля. Если в момент, когда Вы редактируете реквизит, еще один клиент попытается его захватить, то он получит сообщение о невозможности редактировать это поле.
  • освобождение поля - прекращение редактирования поля, после чего другой пользователь сможет его захватить.

По окончании редактирования поля его новое значение немедленно рассылается всем пользователям, которые в данный момент работают с этим же документом.

Во время редактирования поля пользователю доступны все значения этого поля для документов, которые уже есть в базе данных. Получить список можно активизировав локальное меню.

Все, что было сказано о захвате и освобождении полей в полной мере относится и к тексту документа, только возможности его редактирования гораздо шире. Встроенный редактор позволяет редактировать тексты очень больших объемов. Здесь ограничение накладывается только размером оперативной памяти, установленной на компьютере.

Помимо стандартных редакторских функций - выделения, копирования, вставки блоков текста, контекстного поиска, редактор наделен специфическими для системы “ODB-Text” возможностями обработки документов:

  • выделить пункт оглавления,
  • определить смысловое понятие,
  • установить гипертекстовую ссылку,
  • сделать цветовое выделение,
  • вставить OLE-объект.

С помощью редактора системы “ODB-Text” Вы можно создавать сложные составные документы, интегрируя в текст данные различных программ посредством механизма OLE.

Механизм OLE - протокол связывания и внедрения объектов появился в мире Windows сравнительно недавно. Напомним, что он обеспечивает возможность использования в одной Windows - программе данные и объекты другой.

Поддержка механизма OLE существенно расширяет возможности системы “ODB-Text”. Пользователь может составлять документ, собирая его из объектов других программ. Например, составляя аналитический обзор, текст можно набирать непосредственно в редакторе “ODB-Text”, иллюстрации готовить в CorelDRAW!, математические выражения в Microsoft Equation Editor, диаграммы в MS Excel. Такой документ сохраняется в БД точно также, как и другие. Впоследствии его можно загрузить из хранилища и изменить любой OLE-объект, либо вовсе удалить из документа.

При работе с OLE-объектами возможно вставить новый OLE-объект или загрузить его из файла.

Как в случае нового объекта, так и в случае загрузки из файла, можно выбрать режим отображения объекта в виде иконки, то есть, в документе OLE-объект будет выглядеть как небольшая пиктограмма.

Если Вы вставляете документ из файла, то можно поместить в базу только ссылку на файл, оставив сам файл на диске. При этом документ будет проиндексирован и его можно будет найти в полнотекстовом поиске. Если с таким документом произошли какие-либо изменения, то при очередном обращении к нему из системы “ODB-Text” произойдет автоматическая переиндексация и эти изменения будут учтены.

Очевидно, что OLE - интересная и полезная вещь. Более подробно Вы можете прочесть о нем в руководствах по Windows, Windows 95.

Создание отчетов

В версии 3.0 имеется возможность создания отчетов по содержимому базы документов. Например, Вы можете поместить в отчет содержимое рубрики, оформить в виде отчета результат поискового запроса, сделать подборку отдельных документов базы. Программа-клиент ODB-Text формирует файл отчета. Это обычный текстовый файл. В начало отчета записывается информация о времени создания отчета, о пользователе, подготовившем его и т.д. Затем в виде таблички записывается информация о документах, помещенных в отчет. В дальнейшем пользователь может воспользоваться электронной таблицей, например, Microsoft Excel, импортировать отчет ODB-Text чтобы произвести статистические выкладки, построить графики и диаграммы, выявить закономерности в данных отчета и красиво оформить отчет.

Ограничение доступа к документам

Документ может использоваться в режимах просмотра и редактирования, а также может быть удален из БД. Администратор может разрешить или запретить некоторые операции над документами. Например, пользователю Оператор выставлены следующие права доступа к документам - Таблица 3:

Таблица 3

Тип документа

Просмотр

Добавление

Редактирование

Удаление

Нормативный акт

Да

Да

Нет

Нет

Договор

Да

Да

Да

Нет

Приказ

Да

Да

Да

Нет

Платежное поручение

Да

Да

Да

Нет

Инвойс

Да

Да

Да

Нет

Письмо

Да

Да

Да

Да

Это означает, что пользователь Оператор может просматривать все документы в базе, добавлять в базу новые документы, а также редактировать все документы за исключением Нормативных актов. Из всех документов он сможет удалить только письма. При попытке удалить, например, Нормативный акт он получит предупреждение.

Коллективная работа в сетевом режиме

Система “ODB-Text” версии 3.0 разрабатывалась как средство для коллективной работы над документами. Практически во всех фирмах - даже малых - есть локальная сеть, объединяющая компьютеры организации. С помощью “ODB-Text” несколько сотрудников могут одновременно работать над одними и теми же документами.При одновременной работе над одним и тем же документом возникают ситуации когда желательно предупредить пользователя или ограничить его действия - Таблица 4.

Таблица 4

Первый клиент

Второй клиент

Реакция программы

Просмотр Документа.

Просмотр
Документа.

Сообщений нет.

Просмотр Документа.

Редактирование
Документа.

Сообщений нет.

Просмотр Документа.

Удаление
Документа.

Второй клиент получает сообщение
о том, что Документ просматривается другим пользователем и поэтому
удалить его нельзя.

Редактирование Документа.

Просмотр Документа.

Сообщений нет.

Редактирование Документа.

Редактирование Документа.

Сообщений нет.

Редактирование Документа.

Удаление Документа.

Второй клиент получает сообщение
о том, что Документ просматривается другим пользователем и поэтому
удалить его нельзя.

Поскольку рубрикатор тоже может редактироваться, то система предусматривает набор оповещений и для рубрикатора. Пользователь может выполнять также действия по редактированию рубрикатора:

  • создать рубрику
  • изменить название рубрики
  • удалить рубрику
  • занести документ в рубрику
  • удалить документ из рубрики

В Таблице 5 приводятся возможные сценарии работы пользователей и реакция системы. Предполагается, что оба клиента находятся в одной и той же рубрике.

Таблица 5

Первый клиент

Второй клиент

Реакция программы

Создает рубрику “Рубрика А” в корневой рубрике.

Создает рубрику “Рубрика А”
в корневой рубрике.

Сообщение о том, что другой клиент изменяет корневую рубрику.

Находится в рубрике “Рубрика А”.

Изменяется название рубрики на
“Рубрика Б”.

Первый Клиент получает сообщение об изменении названии рубрики.

Находится в рубрике “Рубрика Б”.

Удаление рубрики “Рубрика Б”.

Второй клиент получает сообщение
о том, что рубрика занята и удаление невозможно.

Находится в рубрике “Рубрика Б”.

Добавляет в рубрику “Рубрика Б” документ “Телеграмма от 20.08.06”.

Первый Клиент получает сообщение об изменении содержимого рубрики
и новое наполнение рубрики.

Находится в рубрике “Рубрика Б”.

Удаляет из рубрики “Рубрика Б” документ “Телеграмма от 20.08.06”.

Первый Клиент получает сообщение об изменении содержимого рубрики
и новое наполнение рубрики.

Находится в подрубрике рубрики “Рубрика Б”.

Удаляет рубрику
“Рубрика Б”

Второй Клиент получает сообщение о недопустимости удаления рубрики поскольку где-то в ней находится первый Клиент.

На первый взгляд может показаться, что работать в коллективном режиме сложно, но это не так, потому что система берет на себя рутинные функции оповещения и разделения доступа.

Особая ситуация - режим одновременного редактирования документов. Редактировать документ разрешено одновременно более чем одному пользователю. Но каждый пользователь может редактировать не более одного поля или группы полей документа. Например, один пользователь-оператор может вводить текст документа, а другой - вводить реквизиты. Если же второй пользователь попытается перевести курсор в текст в режиме редактирования, то получит предупреждение о невозможности редактировать текст, так как это поле уже занято другим клиентом системы “ODB-Text”.

Подключение пользователей к различным базам данных

Как уже упоминалось в выше, в корпоративной сети может присутствовать одновременно несколько серверов. Пользователь программы-клиента в течение сеанса работает только с одной базой. Если есть необходимость переключиться на другую базу, Вам необходимо отключиться от сервера и подключиться к другому. Допустим в Вашей рабочей группе ведутся две базы данных на разных компьютерах. Одна - коммерческие договора, другая - входящая/исходящая корреспонденция см. Рис. 5.

Image11.gif

Рис. 5. Различные базы данных в сети.

Пользователь запускает на выполнение программу-клиент, выбирает соответствующий меню, чтобы выбрать север, на котором расположена база данных “Офис”. Затем он вводит сетевой адрес сервера, который должен быть указан ему администратором системы.

Если он будет работать с базой корреспонденции, то следует ввести сетевой адрес сервера, на котором расположена база корреспонденции.

Создание новых типов документов

Система “ODB-Text” поставляется вместе с набором стандартных типов документов для малой и средней коммерческой фирмы. Кроме того, пользователям предлагается возможность создавать новые типы документов для своих нужд и модифицировать существующие. Занимается этим важным и ответственным делом Администратор сети или человек, ответственный за слежение за базами данных. Можно рекомендовать следующий механизм создания новых типов документов:

  1. Пользователь уведомляет Администратора сети о необходимости создания новых типов документов;
  2. Администратор уточняют и согласовывают список реквизитов, их типы (система поддерживает стандартные типы реквизитов - “словосочетание с разбиением”, “словосочетание без разбиения”, “целое число”, “дата”, “вещественное число”, “время”, “телефон”);
  3. Администратор регистрирует новый тип документа и пользователь получает возможность хранить в базе документы нового типа.

Работа с документами “ODB-TEXT” в сети ИНТЕРНЕТ

Программный комплекс ODB-Text версии 3.0 имеет полноценные средства для работы в Интернет. Для этого следует установить Web Сервер ODB-Text на компьютере, где установлен Microsoft Internet Information Server версии 2.0 и выше, а на рабочем месте пользователя должен быть установлен броузер Netscape Navigator 4.0 или Internet Explorer 4.0. Также возможна работа и с более поздними версиями этих броузеров. Процесс подключения к Web Серверу “ODB-Text” аналогичен подключению Программы-клиента к серверу ODB-Text. Пользователь вводит имя и пароль, как это показано на Рис. 6, а затем выбирает ту базу данных, с которой он хочет работать.

Image12.gif

Рис. 6. Подключение к Web Серверу “ODB-Text”
пользователя “Administrator”.

Найти документы в базе можно как с помощью полнотекстового поиска, так и пользуясь каталогом-рубрикатором, который в броузере выглядит в точности так же как и в “ODB-Text”.

После щелчка на имени документа в окно броузера загружается регистрационная карточка документа, в которой можно увидеть реквизиты.

Если пользователь не помнит расположение документа в рубрикаторе, то может воспользоваться поисковыми возможностями ODB-Text. В Интернет-версии возможности поиска ничуть не уступают клиент/серверной версии. Вы можете найти документ как по содержанию реквизитов, так и по содержанию текста документов.

Для каждого поискового поля Вы можете посмотреть список ключей, которые уже хранятся в базе данных. Например, для поля “Название документа” Вы увидите список названий всех документов, которые есть в базе данных.

Для быстрого перемещения по списку ключей на соответствующей страничке есть строка ввода, где можно полностью или частично набрать слово, затем нажать кнопку “Обновить” и список перечитается из базы так чтобы он начинался с введенного пользователем слова или наиболее похожего из числа тех, что есть в базе. Например, если пользователь ввел слово “патент” в окне списка поисковых ключей для названия и нажал кнопку “Обновить”, то он получит список ключей, начиная со слова “патент”, отсортированный по алфавиту.

Слова в тексте, совпадающие со словами в запросе, выделяются жирным шрифтом и мерцанием.

Получив список найденных документов или открыв рубрику с документами, пользователь может просмотреть его. При загрузке в броузер регистрационной карточки документа, множественные реквизиты отображаются как выпадающий список строк. При просмотре текста документа можно перейти к оглавлению документа, спискам ссылок, понятий, точек входа. Точно так же как и в программе-клиенте “ODB-Text” текст документа в броузере содержит гипертекстовые ссылки, понятия, цветовую разметку. При переходе по ссылкам броузер позиционируется в точности на том месте текста, куда указывает ссылка. Документы, вставленные как объекты OLE отображаются как ссылки, например, Рисунок GIF, Документ Microsoft Word и т.д. Чтобы увидеть документ, щелкните левой кнопкой мыши на ссылке и документ будет загружен в броузер.

Во время сеанса работы базы документов могут обновляться. Пока пользователь работает с системой, операторы могут добавить, изменить, удалить документы. Когда новая версия становится доступной, он получает сообщение об изменении баз данных.

При работе с документами “ODB-Text” в сети ИНТЕРНЕТ пользователю доступны все функции используемого им броузера.

С их помощью он легко может сохранить текст документа, распечатать документ, сохранить документ OLE.

В любой момент времени также можно нажать кнопку Back чтобы вернуться на предыдущую страницу броузера, при этом переход произойдет быстрее, так как новая страница не перечитывается с сервера, а загружается из памяти локального компьютера.

Архитектура и возможности конфигурации системы

В системе всегда присутствует сервер документов. Он выполняет команды клиентов добавить, обновить, удалить документы. К серверу подключаются клиенты ODB-Text . Наряду с сервером в система может включать в себя Web-сервер ODB-Text. Web-сервер ODB-Text предоставляет доступ к базе документам через броузер – Netscape Navigator или Internet Explorer версий 4.0 и выше. Оба сервера могут обмениваться информацией согласно заданному расписанию. Например, часть сотрудников может работать над наполнением базы, а другая – пользоваться этой базой как справочником. Первая группа сотрудников работает с помощью специализированной программы-клиента, вторая производят поиск и просмотр документов через броузер. Обе группы работают с разными базами документов– первая группа с более новыми, вторая – с неизменными. Время от времени, например, каждый день в 18.00 или раз в неделю в пятницу в 9.00 обновленная база становится доступной Интернет-пользователям, в то же время работники первой группы продолжают заполнение базы. Работа с системой по такой схеме иллюстрируется Рисунком 7.

Image13.gif

Рис. 7. Схема работы системы.

На рисунке 7 показаны базы документов- хранилища информации, расположенное на компьютерном диске. В системе “ODB-Text” базы данных - это хранилище документов различных типов. В одной БД могут храниться различные документы, но путаницы не происходит вследствие специальной системы управления базой данных.

База документов в “ODB-Text” состоит из имени базы и баз данных сервера. Имя базы это, например, “Офис”, “Библиотека”, “Кадровый учет”. Каждое имя базы соответствует трем базам севера.

База документов “конструируется” из баз данных сервера. Например, базе документов “Офис” назначены три физических базы сервера: config, rubr и main.

Увидеть структуру базы можно, выбрав соответствующий пункт меню программы Сервер.

Сразу после установки на сервере зарегистрированы три базы документов: база “Офис”, база “Библиотека” и база “Кадровый учет”. Администратор сети может удалить базу данных, назначить базе новые файлы данных и индексов. Конечно, он может также добавить новую базу данных (зарегистрировать) на сервере.

Каждая база данных сервера состоит из двух дисковых файлов - файла данных и файла индексов.

Документы записываются как объекты в файл данных с расширением .DS. Предварительно из документа выделяются ключи для быстрого поиска и сохраняются в файле индекса с расширением .ВТ. Таким образом, по содержанию документа всегда можно восстановить список поисковых ключей.

Любое сложное устройство, состоящее из нескольких компонент, требует тщательной тонкой настройки. Только тогда оно работает с полной отдачей. “ODB-Text” не исключение из правил. Система “ODB-Text” имеет широкие возможности конфигурации. Чтобы в полной мере воспользоваться ими Администратор сети должен хорошо представлять себе архитектуру, то есть внутреннее устройство системы “ODB-Text”.

Каждая база сервера имеет свое назначение Документы, с которыми работают пользователи, хранятся в одной базе, которая после установки называется “Main” -Таблица 6.

Таблица 6

Имя базы

Назначение

Config

Хранилище дескрипторов типов документов

Rubr

Хранилище для рубрикатора

Main

Хранилище документов “пользовательских” типов (Нормативный акт, Приказ, Договор, Платежное поручение и т.д.)

Таким образом, пользователь в одном сеансе работы общается с тремя базами данных. Все три базы располагаются на одном сервере. Таким образом, описания структур документов хранятся в базе “Config”, а все документы - в базе данных “Main”. Рубрикатор хранится в базе “rubr” и доступен всем клиентам, подключающимся к данному серверу. Это означает, что если один пользователь изменит рубрикатор, скажем, добавит или удалит рубрику, то такое изменение отразится на всех клиентах, разделяющих базу рубрикатора.

Осталось рассказать как изменить конфигурацию системы “ODB-Text”, чтобы настроить ее в соответствие с нуждами конкретного пользователя. Для используется приложение “Дизайнер Форм”. Его назначение - создание новых типов документов, исправление и удаление существующих. Посмотрим как он работает.

Как и в случае приложения-клиента, работа с Дизайнером Форм начинается с подключения к серверу документов. Как Вы помните, в базе конфигурации всегда находятся описания типов документов, с которыми работают пользователи системы. Эти описания во время подключения загружаются Дизайнером Форм для последующего редактирования. После установки системы базе документов “Офис” соответствует база конфигурации Config. Дизайнер предоставляет пользователю возможность корректировать типы документов, создавать новые и т.п. По окончании работы он сохраняет изменения в конфигурационной базе. Схематически весь процесс выглядит как показано на Рисунке 8.

Image14.gif

Рис. 8. Взаимодействие Дизайнера форм с сервером.

В этом примере Дизайнер Форм подключился к серверу Central к базе “Офис”,. В базе конфигурации изначально присутствовали три типа документов: Договор, Платежное поручение, Накладная. Пользователь добавил новый тип - Налоговая декларация. После сохранения данные о Налоговой декларации занесены в базу конфигурации Config на сервере Central. Теперь пользователи, подключаясь к серверу Central имеют возможность работать с документами типа Налоговой декларации.

Если по каким-либо причинам названия баз данных на сервере изменились, пользователь должен один раз внести соответствующие изменения на сервере и они сразу же будут доступны всем пользователям системы.

В результате получим такую конфигурацию - Таблица 7.

Таблица 7

Назначение базы

Имя базы данных

База конфигурации

Types

База рубрикатора

Contents

База документов пользователя (Нормативный акт, Приказ, Договор, Платежное поручение и т.д.)

Store

Таким образом, все администрирование баз и пользователей сосредоточено на сервере. Теперь самое время подробно остановиться на ряде задач, которые придется решать при настройке системы “ODB-Text”:

  • Назначение пользователю персонального рубрикатора. Первая проблема уже затрагивалась - поскольку сразу после установки системы все пользователи разделяют одну базу рубрикатора, то изменения, внесенные одним человеком, затрагивают всех клиентов, что может быть нежелательным. Возникает потребность дать пользователю возможность вести персональный рубрикатор. Рекомендуемая последовательность действий по изменению конфигурации, которая решает задачу “персонификации” рубрикатора - Таблица 8. Как и прежде все пользователи, за исключением одного, будут обращаться за рубрикатором к одной и той же базе на сервере. Таким образом, один пользователь получает в свое распоряжение базу для рубрикатора. Например, изначально база рубрикатора называлась “rubr”, администратор сервера создал новую базу “cataloge” и подключил к ней одного пользователя;
  • Работа в сети нескольких серверов. Поскольку сеть программный комплекс ODB-Text может функционировать в распределенной сети, то в системе могут одновременно присутствовать несколько серверов. Такая потребность может возникнуть, например, если в компании есть две группы сотрудников, ведущих различные дела и использующих различные документы. Причем, желательно, чтобы руководитель групп имел доступ к обоим серверам. Для определенности положим, что один компьютер называется “Central”, другой имеет имя “Advance”. Цель достигается за несколько шагов - Таблица 9. Теперь осталось обеспечить возможность руководителю групп просматривать обе базы документов. После всех вышеперечисленных действий сделать это очень просто. Достаточно в диалоге введения адреса сервера набрать IP-адрес сервера документов. Таким образом, пользователь сможет работать с сервером соответствующей группы.

Наконец, для большей ясности приведем схему конфигурации системы “ODB-Text” из приведенного выше примера - см. Рисунок 9.

Image15.gif

Рис. 9. Конфигурация с двумя группами пользователей.

 

Таблица 8

Действия Администратора

На сервере создается новая база данных, в которой будет сохраняться индивидуальный рубрикатор, например, cataloge.

На сервере создается новая база документов, например, “Офис - Иванов”, которой назначаются базы сервера, например, база конфигурации - config, база рубрикатора - cataloge, база документов - main.

Таблица 9

Действия

Что происходит в системе

Установить на компьютер “Central” программу-сервер.

На компьютере “Central” устанавливается программа-сервер, базы данных.

Установить на компьютер “Advance” программу-сервер.

На компьютере “Advance” устанавливается программа-сервер, базы данных.

Создать типы документов, с которыми будут работать клиенты сервера “Central”.

В базу на сервере “Central” заносятся типы документов, используемые сотрудниками первой группы. Администратор в начале сеанса работы Дизайнера Форм указывает сетевой адрес сервера “Central”.

Создать типы документов, с которыми будут работать клиенты сервера “Advance”.

В базу на сервере “Advance” заносятся типы документов, используемые сотрудниками первой группы. Администратор в начале сеанса работы Дизайнера Форм указывает сетевой адрес сервера “Advance”.

Установить для всех клиентов первой группы сетевой адрес севера Central.

Каждый пользователь первой группы, начиная сеанс работы, получает доступ к базам данных на сервере “Central”.

Установить для всех клиентов второй группы сетевой адрес севера Advance.

Каждый пользователь второй группы, начиная сеанс работы, получает доступ к базам данных на сервере “Advance”.

Программный комплекс “ODB-Text” способен манипулировать большими объемами данных, что в случае неудачной конфигурации может привести к повышенной нагрузке на сеть. Поэтому Администратору сети следует регламентировать режим наполнения системы “ODB-Text”. Ниже следует несколько полезных советов:

  • Занесение документов большого объема (1 мегабайт текста и более) рекомендуется производить в однопользовательском режиме, чтобы пользователи, занятые другой работой, не ощущали временных задержек;
  • То же самое относится к редактированию (изменению текста, установке гипертекстовых ссылок, выделению понятий, оглавления) документов большого объема;
  • Для базы данных большого объема следует ограничивать полноту поиска по естественноязыковым запросам. Администратор сети может регулировать продолжительность поиска посредством параметра “В документе учитывать не более NNNN вхождений ключа”. Чем меньше это число, тем быстрее выполняется процедура поиска. Для точного поиска этот параметр должен быть установлен как можно большим. По умолчанию он равен 1000, то есть подсистема полнотекстового поиска учитывает только 1000 вхождений каждого ключа (если, конечно, ключ встречается в тексте документа более часто).

Рекомендуем ознакомиться с данными, которые помогут Вам избежать ощутимых временных задержек из-за загрузки сервера при работе в сети и организовать сетевую работу пользователей с максимальной эффективностью - Таблица 10.

Таблица 10

п/п

Сервер установлен на компьютере с микропроцессором, RAM

Рекомендуемый максимальный размер текста документа, килобайт

Рекомендуемый максимальный размер файла, вставляемого как OLE-объект, килобайт

1

80386DX - 40, 8 Мб

40

200

2

80486DX2 - 66, 16 Мб

80

500

3

Pentium - 100, 16 Мб

100

1000

4

Pentium - 133, 32 Мб

200

1000

5

Pentium - 166, 32 Мб

250

1000

6

Pentium - 200, 64 Мб

300

1000

7

Pentium II - 233, 128 Мб

800

2000

Если выполнены все требования, то пользователи не почувствуют заметных задержек при добавлении или редактировании документов. При вставке в документ OLE-объектов большого объема также следует учитывать рекомендации, указанные в таблице 11.

Администратор сети также может регулировать скорость работы механизма полнотекстового поиска, задавая максимальное количество вхождений поискового ключа. Если слово в каком-либо документе встречается чаще, то учитываться будут только первые вхождения. Установка ограничения максимального числа ключей действительна также и для WEB-сервера ODB-Text. Стремясь максимально увеличить производительность системы Администратор не должен забывать о том, что с уменьшением максимального числа вхождений ключа растет вероятность неверного расположения документов в списке - результате поиска.

База данных - вещь очень важная и требует к себе внимательного и заботливого отношения. Тривиально звучит напоминание о необходимости регулярно делать резервные копии. Заниматься этим должен Администратор сети раз в день или в неделю в зависимости от конкретной организации. Существенно помогает использование в качестве носителей информации дисковых систем с избыточностью хранения данных, так называемых RAID-накопителей, эффективно восстанавливающихся после сбоев техники. Впрочем, программа-сервер системы “ODB-Text” предоставляет дополнительные средства во избежание ошибок при работе с БД.

Во-первых, это задание режима транзакций при выполнении всех операций по изменению БД (добавление, редактирование, удаление документа). Что же происходит в этом режиме? Всякий раз перед модификацией базы сохраняется ее состояние. Если во время операции происходит логическая или аппаратная ошибка СУБД просто возвращает базу и ее файлы в исходное состояние. Включить транзакции можно только во время создания базы. Можно рекомендовать включать режим транзакций каждой БД. Единственный его недостаток - некоторое замедление операций модификации дисковых файлов баз данных.

Во-вторых, как и все современные СУБД, “ODB-Text” имеет механизмы, позволяющие исправлять возможные ошибки в системе путем восстановления по файлу данных поисковые ключи. Восстановление индексов возможно только тогда, когда к базе не подключен ни один пользователь.

Мы здесь еще раз призываем пользователей почаще делайте резервные копии баз данных.

Требования к аппаратным и программным средствам для установки системы “ODB-Text”

Для установки клиентской части “ODB-Text” необходимо:

  • Процессор 80386 (или совместимый) или лучше;
  • 8 Мб оперативной памяти;
  • 5 Мб свободного пространства на жестком диске;
  • видео режим 800x600 или лучше;
  • манипулятор мышь;
  • установленная система Windows 3.x/Windows 95/Windows 98 - для 16-битного клиента или установленная система Windows 95/Windows 98/Windows NT 4.0 для 32-битного клиента.

Для установки серверной части ODB-Text:

  • Процессор 80386 (или совместимый) или лучше;
  • 16 Мб оперативной памяти;
  • 15 Мб свободного пространства на жестком диске;
  • видео режим 800x600 или лучше;
  • манипулятор мышь;
  • установленная система Windows 95/Windows 98/Windows NT 4.0;
  • для Windows NT: установленный Microsoft Internet Information Server 2.0 или более новой версии;
  • для Windows 95/Windows 98: установленный Personal Web Server 2.0 или более новой версии.

Программный комплекс “ODB-Text” поставляется на дискетах 3 1/2 дюйма. Количество дискет и состав дистрибутива зависит от платформы.

Области применения системы

Как уже отмечалось выше, основной областью применения программного комплекса “ODB-Text” версии 3.0 является создания и ведения специализированных, максимально учитывающих интересы пользователя открытых информационно-поисковых правовых систем. При этом построенная с использованием данной технологии система может, в случае необходимости проинтегрировать в себя весь документооборот, начиная с договоров и бухгалтерской документации и кончая рекламными буклетами.

Несмотря на малый срок, который прошел с момента появления системы на рынке (первая версия продукта - “ODB-Text” версии 2.0 была аннонсирована в конце 1997 года), с ее помощью был реализован целый ряд крупных проектов. Среди них можно назвать:

  • Использование системы в Совете Федерации Российской Федерации для хранения информационных вестников и стенограмм заседаний;
  • Создание Главной военной прокуратурой РФ специализированной юридической информационной системы;
  • Использование системы компанией “Тройка-Диалог” для построения специализированных информационных систем;
  • Создание первой очереди системы управления документооборотом Московского аэрогеодезического предприятия;
  • Внедрение системы в учебный процесс в Российском Государственном Гуманитарном Университете.

Кроме этого определились и другие области использования системы. К ним можно отнести следующие:

  • Создание информационных систем для издательств. В этом случае очевидны такие преимущества как возможность хранения и поиска текстовой информации больших объемов, многопользовательская сетевая работа с документами, возможность хранения оригинал-макетов изданий, рекламной информации как OLE-объектов;
  • Создание электронных систем учета кадров для малых и средних предприятий. Чтобы построить такую систему достаточно при помощи Дизайнера форм создать карточку реквизитов документа, включив в нее названия полей, необходимых анкетных данных, которые будут потом заполняться посредством программы-клиента. При такой организации в поле текста документа могут храниться автобиография, отсканированный листок по учету кадров и т.д. Главным достоинством такой системы учета кадров будет ее гибкость, то есть возможность быстро изменить ту информацию, которая хранится, ввести новые поисковые поля, исключить старую, потерявшую актуальность информацию;
  • Разработка электронных учебников и электронных учебных пособий. Успех такого использования программного комплекса определяется сочетанием возможностей открытой полнотекстовой системы (в первую очередь широких возможностей поиска информации) и возможностью хранить OLE-объекты, в виде которых можно сохранить любую аудиовизуальную информацию;
  • Создание разного рода библиотечных систем, в которых кроме чисто поисковой информации могут храниться отсканированные электронные копии тех или иных книг;
  • Организация специализированных хранилищ различной информации: медицинских карт, которые наряду с чисто текстовой информацией могут хранить и результаты различных анализов и исследований, если их удастся представить как OLE-объекты, баз данных о лекарствах, баз данных видео-фильмов и слайдов, а также для организации и ведения многих других баз данных в различных областях;
  • Организация специализированных информационных систем для служб безопасности крупных компаний и детективных агенств.

Указав на такие богатые возможности следует отметить, что все они могут быть реализованы у одного пользователя или в виде нескольких баз данных, или даже одной базы данных, содержащей большое число различных типов документов.

Например, некоторое издательство может при помощи нашей системы может вести базу нормативных актов по интересующим разделам законодательства, регистрировать и хранить все свои договора и бухгалтерские документы, тексты и оригинал-макеты изданий, вести свою собственную библиотеку, а также вести учет кадров.

Все созданные базы данных становятся доступными в сетях ИНТЕРНЕТ/ИНТРАНЕТ. Безусловным преимуществом такого подхода является унификация интерфейса программ пользователей: чтобы работать с системой конечному пользователю, который может быть только поверхностно знаком с вычислительной техникой, достаточно изучить одну программу - броузер, но при этом он будет использовать преимущества компьютерных информационных технологий. Все это достигается средствами только одной системы - программного комплекса “ODB-Text” версии 3.0 !

ЛИТЕРАТУРА

  1. А.М. Андреев, Д.В. Березкин, Ю.А. Кантонистов, Ю.М. Смирнов. Объектно-ориентированная база данных “ODB-Jupiter” // Изв. ВУЗов. Приборостроение, Т.41, № 1 - 2, 1998. - с. 40 - 56.
  2. А.М. Андреев, Д.В. Березкин, Ю.А. Кантонистов. Объектно-ориентированная база данных “ODB-Text”// Мир ПК, № 8, 1997. - с. 49 - 52.

ИНТЕЛТЕК ИЗДАТЕЛЬСТВО Обьектные технологии


© НПЦ "ИНТЕЛТЕК ПЛЮС", 1997-2006, E-mail: publish@inteltec.ru