Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Oracle [игнор отключен] [закрыт для гостей] / PDF в Оракл / 16 сообщений из 16, страница 1 из 1
09.12.2016, 20:05
    #39363829
RedRose
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
Народ, помогите, плз
есть большой pdf файл, приблизительно такой структуры:

[IMG] http://i1373.photobucket.com/albums/ag389/torontodowntown/pdf_to_db_zpsjbi5hvam.png [/IMG]
и мне его надо в datawarehouse, т.е. в Оракл.

Как? через bfile и потом парсить? или sqlloader? в идеале было бы через ODI, но там нашла xml структуру только.

Для меня проблема в том, что records сложносоставные, т.е. одна строка <> одна запись

большое спасибо
...
Рейтинг: 0 / 0
09.12.2016, 22:23
    #39363879
JoeD
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
RedRose,

Правильнее было бы добраться до источника с которого файл был сгенерен. "Добраться" в широком смысле, не обязательно коннектом, это может быть feed или просто параллельная выгрузка в другом формате. Помните, что где-то сидят люди которые парились как им выгрузить данные в PDF :)
...
Рейтинг: 0 / 0
09.12.2016, 22:36
    #39363886
RedRose
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
JoeDRedRose,

Правильнее было бы добраться до источника с которого файл был сгенерен. "Добраться" в широком смысле, не обязательно коннектом, это может быть feed или просто параллельная выгрузка в другом формате. Помните, что где-то сидят люди которые парились как им выгрузить данные в PDF :)

нет, не реально получуть ни другой формат, ни источник.
без проблем pdf конвертируется в текстовый файл, и все расстояния сохраняются даже, но мне мне же надо сохранить порядок строк, там одна страница = один клиент
...
Рейтинг: 0 / 0
10.12.2016, 08:17
    #39363975
Elic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
RedRosepdf файл, приблизительно такой структуры:PDF не предназначен для "передачи" данных как таковых.
RedRoseне реально получуть ни другой формат, ни источник.Т.е. это всё, что можно легко украсть, не правда ли?
...
Рейтинг: 0 / 0
10.12.2016, 19:09
    #39364121
RedRose
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
ElicRedRosepdf файл, приблизительно такой структуры:PDF не предназначен для "передачи" данных как таковых.
да. знаю. но заказчик просит и с файлами более простой структуры получается хорошо
RedRoseне реально получуть ни другой формат, ни источник.Т.е. это всё, что можно легко украсть, не правда ли?
нет. не правда. не надо оскорблений. ничего не украдено. здесь нельзя ☺
...
Рейтинг: 0 / 0
10.12.2016, 22:44
    #39364218
Elic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
RedRoseничего не украденоТогда бы можно было договориться о нормальных способах обмена информацией.
...
Рейтинг: 0 / 0
10.12.2016, 23:56
    #39364247
andreymx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
у нас всякие Киевстары и МТСы меняют формат присылаемого файла (билинг) регулярно один-два раза в год
То xls, то csv, то количество или разбивку строк поменяют

Причём без объявления войны. Вдруг звонить пользовател и сообщает, что данные не закачиваются.
...
Рейтинг: 0 / 0
10.12.2016, 23:57
    #39364248
andreymx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
andreymxПричём без объявления войны. Вдруг звонить пользователь и сообщает, что данные не закачиваются.
...
Рейтинг: 0 / 0
11.12.2016, 06:19
    #39364286
Вячеслав Любомудров
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
Ну, у нас та же проблема, например, со списком недействительных паспортов
Хотя, конечно, до PDF они еще не опустились
...
Рейтинг: 0 / 0
11.12.2016, 08:23
    #39364292
Elic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
andreymxменяют формат присылаемого файла (билинг) регулярно один-два раза в год
То xls, то csv, то количество или разбивку строк поменяютФормализованные соглашения об информационном обмене легко оформляются в обоюдоподписанные документы. На худой конец, в публичную офферту, которая должна блюсти совместимость снизу вверх.
В противном случае - бардак.
...
Рейтинг: 0 / 0
11.12.2016, 09:46
    #39364301
landy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
без проблем pdf конвертируется в текстовый файл, и все расстояния сохраняются даже, но мне мне же надо сохранить порядок строк, там одна страница = один клиент

Что значит сохранить порядок строк?
Если все выгружается в текст - в чем проблема распарсить perl'ом, и им же если нужно загрузить
Благо у него для этого куча возможностей
Если одна страница - один клиент, то разделитель клиентов слово Page
...
Рейтинг: 0 / 0
11.12.2016, 13:48
    #39364368
mefman
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
Код: plsql
1.
dbms_photoshop


вроде умел работать с pdf...
...
Рейтинг: 0 / 0
12.12.2016, 04:22
    #39364600
RedRose
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
landyЧто значит сохранить порядок строк?
Если все выгружается в текст - в чем проблема распарсить perl'ом, и им же если нужно загрузить
Благо у него для этого куча возможностей
Если одна страница - один клиент, то разделитель клиентов слово Page

Спасибо, буду пытаться с Perl, ну, или убедить начальство,что это не очень возможно и хорошо.
На самом деле я надеялась,что можно сделать через ODI, там есть я черта импортировать сложный им файл, только XML формат присутствует
...
Рейтинг: 0 / 0
12.12.2016, 12:45
    #39364790
Кроик Семён
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
RedRose,

может вам повезет и к PDF-файлу прилагается XML с содержимым, посмотрите в PDF-файле на вкладке "Attachments". В Германии вот начали уже так счета распространять в формате ZUGFeRD
...
Рейтинг: 0 / 0
12.12.2016, 12:47
    #39364792
Кроик Семён
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
P.S.
...
Рейтинг: 0 / 0
12.12.2016, 13:40
    #39364834
XMLer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
PDF в Оракл
andreymxу нас всякие Киевстары и МТСы меняют формат присылаемого файла (билинг) регулярно один-два раза в год

IPS тоже
...
Рейтинг: 0 / 0
Форумы / Oracle [игнор отключен] [закрыт для гостей] / PDF в Оракл / 16 сообщений из 16, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]