|
|
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
Народ, помогите, плз есть большой pdf файл, приблизительно такой структуры: [IMG] http://i1373.photobucket.com/albums/ag389/torontodowntown/pdf_to_db_zpsjbi5hvam.png [/IMG] и мне его надо в datawarehouse, т.е. в Оракл. Как? через bfile и потом парсить? или sqlloader? в идеале было бы через ODI, но там нашла xml структуру только. Для меня проблема в том, что records сложносоставные, т.е. одна строка <> одна запись большое спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2016, 20:05 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
RedRose, Правильнее было бы добраться до источника с которого файл был сгенерен. "Добраться" в широком смысле, не обязательно коннектом, это может быть feed или просто параллельная выгрузка в другом формате. Помните, что где-то сидят люди которые парились как им выгрузить данные в PDF :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2016, 22:23 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
JoeDRedRose, Правильнее было бы добраться до источника с которого файл был сгенерен. "Добраться" в широком смысле, не обязательно коннектом, это может быть feed или просто параллельная выгрузка в другом формате. Помните, что где-то сидят люди которые парились как им выгрузить данные в PDF :) нет, не реально получуть ни другой формат, ни источник. без проблем pdf конвертируется в текстовый файл, и все расстояния сохраняются даже, но мне мне же надо сохранить порядок строк, там одна страница = один клиент ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2016, 22:36 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
RedRosepdf файл, приблизительно такой структуры:PDF не предназначен для "передачи" данных как таковых. RedRoseне реально получуть ни другой формат, ни источник.Т.е. это всё, что можно легко украсть, не правда ли? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2016, 08:17 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
ElicRedRosepdf файл, приблизительно такой структуры:PDF не предназначен для "передачи" данных как таковых. да. знаю. но заказчик просит и с файлами более простой структуры получается хорошо RedRoseне реально получуть ни другой формат, ни источник.Т.е. это всё, что можно легко украсть, не правда ли? нет. не правда. не надо оскорблений. ничего не украдено. здесь нельзя ☺ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2016, 19:09 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
RedRoseничего не украденоТогда бы можно было договориться о нормальных способах обмена информацией. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2016, 22:44 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
у нас всякие Киевстары и МТСы меняют формат присылаемого файла (билинг) регулярно один-два раза в год То xls, то csv, то количество или разбивку строк поменяют Причём без объявления войны. Вдруг звонить пользовател и сообщает, что данные не закачиваются. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2016, 23:56 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
andreymxПричём без объявления войны. Вдруг звонить пользователь и сообщает, что данные не закачиваются. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2016, 23:57 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
Ну, у нас та же проблема, например, со списком недействительных паспортов Хотя, конечно, до PDF они еще не опустились ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2016, 06:19 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
andreymxменяют формат присылаемого файла (билинг) регулярно один-два раза в год То xls, то csv, то количество или разбивку строк поменяютФормализованные соглашения об информационном обмене легко оформляются в обоюдоподписанные документы. На худой конец, в публичную офферту, которая должна блюсти совместимость снизу вверх. В противном случае - бардак. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2016, 08:23 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
без проблем pdf конвертируется в текстовый файл, и все расстояния сохраняются даже, но мне мне же надо сохранить порядок строк, там одна страница = один клиент Что значит сохранить порядок строк? Если все выгружается в текст - в чем проблема распарсить perl'ом, и им же если нужно загрузить Благо у него для этого куча возможностей Если одна страница - один клиент, то разделитель клиентов слово Page ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2016, 09:46 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
Код: plsql 1. вроде умел работать с pdf... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2016, 13:48 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
landyЧто значит сохранить порядок строк? Если все выгружается в текст - в чем проблема распарсить perl'ом, и им же если нужно загрузить Благо у него для этого куча возможностей Если одна страница - один клиент, то разделитель клиентов слово Page Спасибо, буду пытаться с Perl, ну, или убедить начальство,что это не очень возможно и хорошо. На самом деле я надеялась,что можно сделать через ODI, там есть я черта импортировать сложный им файл, только XML формат присутствует ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.12.2016, 04:22 |
|
||
|
PDF в Оракл
|
|||
|---|---|---|---|
|
#18+
RedRose, может вам повезет и к PDF-файлу прилагается XML с содержимым, посмотрите в PDF-файле на вкладке "Attachments". В Германии вот начали уже так счета распространять в формате ZUGFeRD ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.12.2016, 12:45 |
|
||
|
|

start [/forum/topic.php?fid=52&msg=39363886&tid=1886840]: |
0ms |
get settings: |
7ms |
get forum list: |
9ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
19ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
| others: | 197ms |
| total: | 282ms |

| 0 / 0 |
