Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Известно, что файлы формата DOC в формате UTF. Как ни пробовал, мне не удается прочитать и вывести на экран содержимое файла. Вообще это возможно ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.09.2006, 15:50 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Николай_что файлы формата DOC в формате UTF. где Вы такую глупость прочитали? Есть утилиты, которые позволяют конвертировать из формата doc в rtf ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.09.2006, 16:22 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Если кому интересно: PHP cкрипт, преобразующий документы MS Word в текст ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.09.2006, 17:35 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Не люблю вот так просто брать и копипастить чужие скрипты тем более когда не понимаю их логики. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. вот написал свой код чтения Word (doc) файлов основываясь на познании что doc это OLE2 контейнер. Как видно дошел до самого интересного момента, прочитал внутренний заголовок потока "WordDocument". А вот дальше не знаю, что с этим всем делать. sign судя документации http://www.uinc.ru/articles/39 говорит, что и вправду имеем дело с WordDocument, но значения txt_start , txt_end , txt_size1 и txt_size2 показывают какую то ерунду. txt_start явно не смещение в потоке для текста. Прошу помочь дальше разобраться. В документацию на странице http://www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx просьба не тыкать. Там для Word-а 210 страниц буржуйского текста. А учитывая, что надо читать вчитываясь в запутанный смысл, я это до конца жизни не прочту, вот если найдется переведенный на русский вариант этого чтива было бы супер. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.06.2009, 07:02 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Вы уж определитесь, или Вы не любите брать чужой код и вчитываетесь в документацию, или Вы берёте чужой код и забиваете на документацию. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.06.2009, 12:44 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Guest, предпочитаю вчитываться в документацию, но только на своем родном языке. А по поводу чтения документов Word, я всетаки победил!!! Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. Не правда ли красиво получилось? ;) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.06.2009, 13:03 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
NT Man Код: plaintext 1. 2. Не правда ли красиво получилось? ;) не правда =) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.06.2009, 14:11 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Уважаемый NT Man. Подскажите пожалуйста, как сделать чтобы Ваш код, также читал кирилицу. А то она у меня совершенно не отображается. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.07.2011, 09:29 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
Не подскажите что хранится в файле OLE.php??? Спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.02.2012, 17:31 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
ждем продолжения в 2014 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.02.2012, 18:04 |
|
||
|
(PHP) чтение файла DOC на PHP
|
|||
|---|---|---|---|
|
#18+
OLE.php - это пакет PHP PEAR, можно найти в интернете. По последнему коду, выложенному здесь, есть ошибка. Выбирать текст нужно в 3 этапа: 1. txt_start - txt_end 2. iconv(UTF-16LE -> UTF-8) 3. mb_substr(txt, txt_size1, txt_size2, UTF-8) И на выходе мы получаем весь текст из Word-документа :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2015, 14:01 |
|
||
|
|

start [/forum/topic.php?fid=23&tid=1462028]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
78ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
35ms |
get tp. blocked users: |
1ms |
| others: | 246ms |
| total: | 401ms |

| 0 / 0 |
