|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
Доброе время суток! Помогите решить проблему, есть документы в PDF, создавал их не я. Мне нужно конвертировать часть, или полностью документ в Word. Проблема в том, что при копировании части текста из PDF в Word, или при конвертации программой не OCR (SolidDocuments), в полученном документе не буквы, а иероглифы. Причину этого не знаю (шрифта такого нет у меня, или исходный документ с которого сляпали PDF со странной кодировкой) Можно в принципе и через OCR (ABBYY FineReader), но в некоторых таких документах есть таблицы и рисунки, а оно их криво сделает, придется редактировать. Есть ли какой-то способ по проще это сделать??? Если нет, то буду через ABBYY FineReader, но не сильно охота. Пример такого документа прикрепляю ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 10:15 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
fine reader - единственный варик ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 10:23 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
PlanBfine reader - единственный варик Надеюсь что не единственный. Ведь документ этот изначально был не PDF, значит должен быть способ вернуть его в первоначальный вид, только мы об этом способе не знаем.)) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 10:43 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
The_IvanPlanBfine reader - единственный варик ...документ этот изначально был не PDF, значит должен быть способ вернуть его в первоначальный вид, только мы об этом способе не знаем.)) Фарш тоже изначально был куском мяса. Только мы ничего не знаем о способе вернуть его в исходное состояние ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 10:53 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
The_Ivan, и не узнаем. Если у Вас была картинка .jpeg, а затем Вы пересохранили её в формате .gif, затем .gif - в .png, а .png - в .bmp. Сможете узнать первоначальное расширение файла, открыв .bmp? Естественно, нет. Так же и с PDF. Это уже самостоятельный файл и никаких данных от его первоисточника там нет, которые помогли бы в вопросе расшифровки текста. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 10:56 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
The_IvanPlanBfine reader - единственный варик Надеюсь что не единственный. Ведь документ этот изначально был не PDF, значит должен быть способ вернуть его в первоначальный вид, только мы об этом способе не знаем.))ну эта.. удачи ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 11:09 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
В принципе я рад, что это всех веселит, но все же Serge 007 , я думаю такие сравнения не сильно подходят к данному случаю The_Prist , то что автор чесал левое ухо правой рукой, у меня сомнения (т.е. перегонял из формата в формат, пока не родил PDF), может я конечно не корректно выразился, но я же не притендую на то, чтоб откатить в родительский формат. По большому счету, можно конечно через SolidDocuments перевести в Word, получим документ с иероглифами, потом посмотрим какой иероглиф отвечает какой букве или знаку в Кирилеце и с помощью автозамены подогнать все, но это тоже долго. Вот я и интересуюсь, может кто до этого сталкивался с этим и нашел решение по мимо тех, которые я знаю. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:13 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
The_Ivan, гуглите запрос "из pdf в word". ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:16 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
То, что это можно сделать и подтверждает то, что если скопировать иероглифы и прибегнуть к http://www.online-decoder.com/ru, то получается исходный текст. Но этот способ не особо удобен, а я не могу найти программу, которая работала по такому же принципу. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:20 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
можно. есть куча он-лайн конверторов. к примеру http://www.pdfonline.com/pdf-to-word-converter/ я конвертнул, потом чуть поправил RTF шрифты и кодовую страницу, чтоб "рисовали" кириллицу и все получилось. Ну может чуть форматирование поправить ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:23 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
Диклевич Александрчуть поправил RTF шрифты и кодовую страницу, чтоб "рисовали" кириллицу и все получилось. Ну может чуть форматирование поправить Спасибо большое, я может задам глупый вопрос, но я не помню как менять кодовую страницу , и что вы имели в виду, под поправил RTF шрифты ? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:38 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
после конвертации открыл в Notepad++: 1) поменял Encoding -> Character Sets -> Cyrillic -> Windows-1251; 2) в самом документе в шапке ansicpg1252 на ansicpg1251 (согласно этому http://idiom.ucsd.edu/~rlevy/cyrillic_under_dmdx/); 3) там же в начале все fcharset0 на fcharset204 (по той же ссылке); сохранил, открыл в Word, ОК. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 12:54 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
Диклевич Александр, Спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 13:24 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
Диклевич Александр, Я дико извиняюсь, но у меня что-то не вышло((((( Можно я вам на почту (видел она у вас не скрыта) скину три документа в RTF, в которых у меня не выходит поменять кодировку??? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 13:54 |
|
!!!Нужна помощь!!!
|
|||
---|---|---|---|
#18+
The_Ivan, можно попробовать ... |
|||
:
Нравится:
Не нравится:
|
|||
07.11.2012, 14:04 |
|
|
start [/forum/topic.php?fid=61&msg=38027971&tid=2175241]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
57ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
others: | 15ms |
total: | 172ms |
0 / 0 |