|
|
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Приветствую форумчане. Прошу помощи в вопросе с перекодированием. Написал скрипт для автоперевода при помощи сервиса bing Изначально он был написан для перевода через copy-paste на страничке отображалось текстовое поле и туда копировали наш перевод. Задумалось не занимаясь копипастом работать прямо с файлом. открыть файл - считать в текстовое поле - перевести - записать перевод. И вот тут пошли грабли. Файл изначально в кодировке UNIX ANSI с переносами строк 0x0A при записи файла в массив, он перекодируется в ANSII после прохождения через api переводчика текст становится utf-8 но при формировании результата он опять превращается в ASCII И все бы хорошо, но при записи в файл перевода он перед переведенной строкой вставляет 3 байта BOM(не вначале файла). \xEF\xBB\xBF - видно лишь в 16h иногда можно увидеть и в поле перевода. Итак вопрос как мне ПРОГРАММНО (не надо меня посылать руками конвертировать в Notepad++) удалять BOM а еще лучше вообще его не получать. Результирующий файл должен быть лучше конечно в чистом UTF-8 без BOM либо в UNIX ANSI не настаивать на использовании iconv и других кодировщиков в контексте "А чем Вам iconv не угодил?" без самостоятельной проверки не рекомендуется. Извините если дерзко написал, но хочется конструктивных ответов, а не воду, которую я и так уже на протяжении дня перечитал и перепробовал. Хотя все может оказаться куда более проще либо наоборот. Используется denwer 5.3 + eclipse скрипт большой выкладываю так https://www.dropbox.com/s/syy02y7vkcr6vu4/index111.rar С ув. Антон. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 12:57 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
если делать телодвижения через буфер, то все работает( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 17:07 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Kreolскрипт большойХорошо что предупредили. Вряд ли найдутся желающие разбираться в _большом_ скрипте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 17:29 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
ну не настолько он большой, просто в 100кб не вместится. А если бы кто подсказал куда смотреть... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 17:44 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Kreol, Не проверял, но идея такая: Код: php 1. 2. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 19:24 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Код: php 1. Прочитать первые 4 байта и поглядеть что в них, если это БОМ, то удалить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 19:25 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
или 3 ли их там ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 19:26 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 21:27 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 21:39 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Код: php 1. 2. 3. 4. не работает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 22:14 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Мдяяя.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.12.2012, 22:22 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
а без сарказма? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 00:37 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Без сарказма - все плохо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 00:50 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
а я с этой кодтровкой не соврать сутки уже сижу, и мне уже плакать охота и отказатся от поиска решений. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 01:13 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Kreol Код: php 1. 2. 3. 4. не работает. а я с этой кодтровкой не соврать сутки уже сижу, и мне уже плакать охота и отказатся от поиска решений. Утро вечера мудренее, а если нет то fopen + fread + fclose = святая троица ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 01:30 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Поэкспериментировав прошу опять помощи. Итак: текст получает BOM вначале строки после похода на сайт за переводом. Если после этого удалить BOM то все превращается в кракозяблики. при открытии программой poedit.exe ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 02:50 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 02:56 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
Kreolфайл после получки. и скрин из poeditТекст из прилагаемого файла - в utf-8. Ваш poedit понимает многобайтовую кодировку? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 10:58 |
|
||
|
BOM при сохранении кодировки utf-8
|
|||
|---|---|---|---|
|
#18+
да может поддерживать http://img850.imageshack.us/img850/1839/66509683.jpg ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.12.2012, 12:03 |
|
||
|
|

start [/forum/topic.php?fid=23&msg=38071823&tid=1464325]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
60ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
73ms |
get tp. blocked users: |
2ms |
| others: | 233ms |
| total: | 414ms |

| 0 / 0 |
