кто знает чтонибуть о бинарном формате DOC / Microsoft Office

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / кто знает чтонибуть о бинарном формате DOC

4 сообщений из 4, страница 1 из 1

кто знает чтонибуть о бинарном формате DOC

#36103960

badboychik

Участник

Откуда: :ɐдʎɯɯО

Сообщения: 3 966

Рейтинг: 0 / 0

встала задача достать текст из документов, не имея ворда. Обнаружил что текст находится в простом Юникоде, начинается по смещению 0хА00 и идет блоками. Проблема в том что блоки разной длины, в основном кратные 2кБ и прерываются посторонней кашей. Можно просто выдирать символы из диапазона А-я +ASCII, но в конце идет служебная инфа, названия шрифтов и т.п., которые проходят этот фильтр и проскакивают...
Вот найти бы волшебное место в файле где указаны все смещения и длины блоков :)
Ну а задача максимум - еще и картинки повытаскивать

...

Рейтинг:

0 / 0

22.07.2009, 19:02:11

| Ответить | Цитировать | Написать

кто знает чтонибуть о бинарном формате DOC

#36104008

mds_world

Участник

Откуда: Ташкент

Сообщения: 27 530

Рейтинг: 0 / 0

Как вариант

Можно воспользоваться стандартным WorPad. Он умеет читать вордовские доки и сохранять их в .TXT и в .RTF. Откуда уже не столь сложно взять все, что нужно.

...

Рейтинг:

0 / 0

22.07.2009, 19:25:22

| Ответить | Цитировать | Написать

кто знает чтонибуть о бинарном формате DOC

#36104102

badboychik

Участник

Откуда: :ɐдʎɯɯО

Сообщения: 3 966

Рейтинг: 0 / 0

нее, надо чтоб можно было например из под линуха вытащить текст или изпод смартфона... :)
вот нашел реализацию, исходники бы вытянуть...

...

Рейтинг:

0 / 0

22.07.2009, 20:23:00

| Ответить | Цитировать | Написать

кто знает чтонибуть о бинарном формате DOC

#36105569

ЛиП

Участник

Сообщения: 356

Рейтинг: 0 / 0

Форматы давно открыты
http://www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx

...

Рейтинг:

0 / 0

23.07.2009, 14:23:54

| Ответить | Цитировать | Написать

4 сообщений из 4, страница 1 из 1

Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / кто знает чтонибуть о бинарном формате DOC

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=61&tid=2179256]:	0ms
get settings:	11ms
get forum list:	22ms
check forum access:	3ms
check topic access:	3ms
track hit:	305ms
get topic data:	9ms
get forum data:	2ms
get page messages:	31ms
get tp. blocked users:	1ms
others:	237ms

total:	624ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы