powered by simpleCommunicator - 2.0.50     © 2025 Programmizd 02
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Система загрузки информации из разных источников
5 сообщений из 5, страница 1 из 1
Система загрузки информации из разных источников
    #34501990
Bely
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть такая задача - необходимо уметь загружать информацию из разнородных источников.
Часто это бывает слабоструктурированная информация, типо HTML страниц.

Пример страницы , которую хочется уметь загружать.

Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу.

Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников?
...
Рейтинг: 0 / 0
Система загрузки информации из разных источников
    #34502057
Фотография softwarer
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BelyСталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников?
Если есть возможность, поболтайте с людьми из Oracle CIS - демонстрировали они это направление, кажется в составе Oracle Portal. Конкретно я не смотрел, неинтересно было.
...
Рейтинг: 0 / 0
Система загрузки информации из разных источников
    #34502635
Фотография timda
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
в 1999-2000 годах по моему было очень популярно так называемое даунлодерство.
Обкачивались яху, монстры, джобы западные! ;-)
У нас такая своя написана для определенной задачи, но обкачка согласована с представителями сайтов на оф уровне.

stikler.ru
...
Рейтинг: 0 / 0
Система загрузки информации из разных источников
    #34502942
dvvv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IMHO все системы типа SAP BW, Oracle OLAP этим занимаются. Имеют настаиваемые или дописываемые экстракторы для источников данных разных типов.
...
Рейтинг: 0 / 0
Система загрузки информации из разных источников
    #34503552
Майевтик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
BelyЕсть такая задача - необходимо уметь загружать информацию из разнородных источников.
Часто это бывает слабоструктурированная информация, типо HTML страниц.

Пример страницы , которую хочется уметь загружать.

Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу.

Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников?Во-первых - точно ли нет смысла попытаться договориться с этими источниками, чтобы они вам инфу в XML/RSS выдавали? Иначе ведь если экстрактор жёстко настраивать на каждый отдельный источник, при изменении формата выдачи придётся переписывать правила. Про прелести стандартизации все знают, но я ещё раз напомню .

Во-вторых - в вебе наверняка таких систем много. Я приведу в качестве примера 2 известных мне системы, по крайне мере вторая - Open Source:

1) Импорт табличных данных из произвольной HTML-страницы в сервисе по созданию эргономичных онлайновых баз данных DabbeDB ;

2) Плагин для FireFox по импорту в обобщённое хранилище произвольного веб-контента PiggyBank .

По поводу Enterprise-решений - не верю, что там это решается малой кровью. У Enterprise традиционно плохо со слабоструктурированными данными.
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Система загрузки информации из разных источников
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]