
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
03.05.2007, 13:23
|
|||
|---|---|---|---|
Система загрузки информации из разных источников |
|||
|
#18+
Есть такая задача - необходимо уметь загружать информацию из разнородных источников. Часто это бывает слабоструктурированная информация, типо HTML страниц. Пример страницы , которую хочется уметь загружать. Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу. Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
03.05.2007, 13:34
|
|||
|---|---|---|---|
Система загрузки информации из разных источников |
|||
|
#18+
BelyСталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников? Если есть возможность, поболтайте с людьми из Oracle CIS - демонстрировали они это направление, кажется в составе Oracle Portal. Конкретно я не смотрел, неинтересно было. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
03.05.2007, 15:43
|
|||
|---|---|---|---|
Система загрузки информации из разных источников |
|||
|
#18+
в 1999-2000 годах по моему было очень популярно так называемое даунлодерство. Обкачивались яху, монстры, джобы западные! ;-) У нас такая своя написана для определенной задачи, но обкачка согласована с представителями сайтов на оф уровне. stikler.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
03.05.2007, 16:56
|
|||
|---|---|---|---|
Система загрузки информации из разных источников |
|||
|
#18+
IMHO все системы типа SAP BW, Oracle OLAP этим занимаются. Имеют настаиваемые или дописываемые экстракторы для источников данных разных типов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
03.05.2007, 22:46
|
|||
|---|---|---|---|
|
|||
Система загрузки информации из разных источников |
|||
|
#18+
BelyЕсть такая задача - необходимо уметь загружать информацию из разнородных источников. Часто это бывает слабоструктурированная информация, типо HTML страниц. Пример страницы , которую хочется уметь загружать. Само собой, человек должен указать какой-то шаблон как искать данные - а затем уже программа все это грузит в какую-нибудь таблицу. Сталкивался кто-нибудь с системами, которые позволяют загружать данные из таких источников?Во-первых - точно ли нет смысла попытаться договориться с этими источниками, чтобы они вам инфу в XML/RSS выдавали? Иначе ведь если экстрактор жёстко настраивать на каждый отдельный источник, при изменении формата выдачи придётся переписывать правила. Про прелести стандартизации все знают, но я ещё раз напомню . Во-вторых - в вебе наверняка таких систем много. Я приведу в качестве примера 2 известных мне системы, по крайне мере вторая - Open Source: 1) Импорт табличных данных из произвольной HTML-страницы в сервисе по созданию эргономичных онлайновых баз данных DabbeDB ; 2) Плагин для FireFox по импорту в обобщённое хранилище произвольного веб-контента PiggyBank . По поводу Enterprise-решений - не верю, что там это решается малой кровью. У Enterprise традиционно плохо со слабоструктурированными данными. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=33&mobile=1&tid=1549095]: |
0ms |
get settings: |
8ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
169ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
38ms |
get tp. blocked users: |
1ms |
| others: | 11ms |
| total: | 255ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...