
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
09.12.2012, 12:57
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Приветствую форумчане. Прошу помощи в вопросе с перекодированием. Написал скрипт для автоперевода при помощи сервиса bing Изначально он был написан для перевода через copy-paste на страничке отображалось текстовое поле и туда копировали наш перевод. Задумалось не занимаясь копипастом работать прямо с файлом. открыть файл - считать в текстовое поле - перевести - записать перевод. И вот тут пошли грабли. Файл изначально в кодировке UNIX ANSI с переносами строк 0x0A при записи файла в массив, он перекодируется в ANSII после прохождения через api переводчика текст становится utf-8 но при формировании результата он опять превращается в ASCII И все бы хорошо, но при записи в файл перевода он перед переведенной строкой вставляет 3 байта BOM(не вначале файла). \xEF\xBB\xBF - видно лишь в 16h иногда можно увидеть и в поле перевода. Итак вопрос как мне ПРОГРАММНО (не надо меня посылать руками конвертировать в Notepad++) удалять BOM а еще лучше вообще его не получать. Результирующий файл должен быть лучше конечно в чистом UTF-8 без BOM либо в UNIX ANSI не настаивать на использовании iconv и других кодировщиков в контексте "А чем Вам iconv не угодил?" без самостоятельной проверки не рекомендуется. Извините если дерзко написал, но хочется конструктивных ответов, а не воду, которую я и так уже на протяжении дня перечитал и перепробовал. Хотя все может оказаться куда более проще либо наоборот. Используется denwer 5.3 + eclipse скрипт большой выкладываю так https://www.dropbox.com/s/syy02y7vkcr6vu4/index111.rar С ув. Антон. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 17:07
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
если делать телодвижения через буфер, то все работает( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 17:29
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Kreolскрипт большойХорошо что предупредили. Вряд ли найдутся желающие разбираться в _большом_ скрипте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 17:44
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
ну не настолько он большой, просто в 100кб не вместится. А если бы кто подсказал куда смотреть... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 19:24
|
|||
|---|---|---|---|
|
|||
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Kreol, Не проверял, но идея такая: Код: php 1. 2. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 19:25
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Код: php 1. Прочитать первые 4 байта и поглядеть что в них, если это БОМ, то удалить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 19:26
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
или 3 ли их там ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 21:27
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 21:39
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 22:14
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Код: php 1. 2. 3. 4. не работает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.12.2012, 22:22
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Мдяяя.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 00:37
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
а без сарказма? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 00:50
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Без сарказма - все плохо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 01:13
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
а я с этой кодтровкой не соврать сутки уже сижу, и мне уже плакать охота и отказатся от поиска решений. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 01:30
|
|||
|---|---|---|---|
|
|||
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Kreol Код: php 1. 2. 3. 4. не работает. а я с этой кодтровкой не соврать сутки уже сижу, и мне уже плакать охота и отказатся от поиска решений. Утро вечера мудренее, а если нет то fopen + fread + fclose = святая троица ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 02:50
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Поэкспериментировав прошу опять помощи. Итак: текст получает BOM вначале строки после похода на сайт за переводом. Если после этого удалить BOM то все превращается в кракозяблики. при открытии программой poedit.exe ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 02:56
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 10:58
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
Kreolфайл после получки. и скрин из poeditТекст из прилагаемого файла - в utf-8. Ваш poedit понимает многобайтовую кодировку? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
10.12.2012, 12:03
|
|||
|---|---|---|---|
BOM при сохранении кодировки utf-8 |
|||
|
#18+
да может поддерживать http://img850.imageshack.us/img850/1839/66509683.jpg ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=23&tablet=1&tid=1464325]: |
0ms |
get settings: |
6ms |
get forum list: |
18ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
178ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
70ms |
get tp. blocked users: |
2ms |
| others: | 200ms |
| total: | 494ms |

| 0 / 0 |
