Система обработки потока новостей

1 июля завершена разработка системы автоматизации построения подборок новостей, построенной на основе ИПС ODB-Text. Система обеспечивает автоматический сбор информации из сети Internet с нескольких новостных сайтов, обработку новостных сообщений, заключающейся в преобразовании их к единому формату отображения, отсечения рекламы и лишнего оформления. Полученные сообщения помещаются в БД, где подвергаются рубрицированию. Далее, редактор, при помощи специальной программы, контролирует правильность рубрицирования, удаляет лишние сообщения, посвященные одному и тому же событию, удаляет ненужные сообщения. Сообщения, прошедшие контроль редактором, становятся доступными остальным пользователям системы.

Таким образом, система позволяет быстро сформировать подборку новостей по заданной тематике, за заданный период времени или просто ознакомиться с последними новостями. Кроме того, все сообщения разделяются на рубрики и имеют набор дополнительных полей.

Система состоит из модуля сбора информации из Интернет, который осуществляет первичный сбор информации из Интернет и отсечение ненужного оформления, модуля преобразования данных, который производит упаковку полученных на предыдущем этапе html-страниц и изображений в единый файл, предназначенный для загрузки в ODB-Text. Полученные файлы автоматически помещаются в БД для их рубрицирования и цензурирования редакторами. Специальная программа, позволяет запустить процесс автоматического распределения сообщений по рубрикам, проверить правильность распределения и, если потребуется, вручную поместить сообщение в правильную рубрику.


Пользователи системы, при помощи обычного Интернет браузера получают доступ к БД. Они могут просматривать сообщения либо посредством просмотра подготовленных редактором сообщений, либо через поиск.