|
Система загрузки информации из разных источников
|
|||
---|---|---|---|
#18+
Есть такая задача - необходимо уметь загружать информацию из разнородных источников. Часто это бывает слабоструктурированная информация, типо HTML страниц. Пример страницы , которую хочется уметь загружать. Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу. Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников? ... |
|||
:
Нравится:
Не нравится:
|
|||
03.05.2007, 13:23 |
|
Система загрузки информации из разных источников
|
|||
---|---|---|---|
#18+
BelyСталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников? Если есть возможность, поболтайте с людьми из Oracle CIS - демонстрировали они это направление, кажется в составе Oracle Portal. Конкретно я не смотрел, неинтересно было. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.05.2007, 13:34 |
|
Система загрузки информации из разных источников
|
|||
---|---|---|---|
#18+
в 1999-2000 годах по моему было очень популярно так называемое даунлодерство. Обкачивались яху, монстры, джобы западные! ;-) У нас такая своя написана для определенной задачи, но обкачка согласована с представителями сайтов на оф уровне. stikler.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
03.05.2007, 15:43 |
|
Система загрузки информации из разных источников
|
|||
---|---|---|---|
#18+
IMHO все системы типа SAP BW, Oracle OLAP этим занимаются. Имеют настаиваемые или дописываемые экстракторы для источников данных разных типов. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.05.2007, 16:56 |
|
Система загрузки информации из разных источников
|
|||
---|---|---|---|
#18+
BelyЕсть такая задача - необходимо уметь загружать информацию из разнородных источников. Часто это бывает слабоструктурированная информация, типо HTML страниц. Пример страницы , которую хочется уметь загружать. Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу. Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников?Во-первых - точно ли нет смысла попытаться договориться с этими источниками, чтобы они вам инфу в XML/RSS выдавали? Иначе ведь если экстрактор жёстко настраивать на каждый отдельный источник, при изменении формата выдачи придётся переписывать правила. Про прелести стандартизации все знают, но я ещё раз напомню . Во-вторых - в вебе наверняка таких систем много. Я приведу в качестве примера 2 известных мне системы, по крайне мере вторая - Open Source: 1) Импорт табличных данных из произвольной HTML-страницы в сервисе по созданию эргономичных онлайновых баз данных DabbeDB ; 2) Плагин для FireFox по импорту в обобщённое хранилище произвольного веб-контента PiggyBank . По поводу Enterprise-решений - не верю, что там это решается малой кровью. У Enterprise традиционно плохо со слабоструктурированными данными. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.05.2007, 22:46 |
|
|
start [/forum/topic.php?fid=33&fpage=52&tid=1549095]: |
0ms |
get settings: |
10ms |
get forum list: |
15ms |
check forum access: |
9ms |
check topic access: |
9ms |
track hit: |
44ms |
get topic data: |
13ms |
get forum data: |
2ms |
get page messages: |
50ms |
get tp. blocked users: |
1ms |
others: | 266ms |
total: | 419ms |
0 / 0 |