|
|
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
Здравствуйте. Подскажите пожалуйста. Есть текстовый файл в котором информация (кирилица + латиница) представлена в 2х разных кодировках. Текстовые редакторы, такие как Notepad++ и UltraEdit отображают текст правильно (то есть, они своими "мозгами" понимают, что текст представлен в различных кодировках), но при попытке сохранить файл в конкретной (одной) кодировке они выполняю преобразование не верно. Вопрос в следующем. Есть ли (не важно у какого языка программирования) готовый инструментарий (функция к примеру) с помощью которого можно выполнить правильное преобразование. Или может кто предложет примерный "алгорит" преобразования. Или возможно существуют приложения умеющие выполнять подобные преобразования. вот пример (обе строки находятся в одном и том же файле): Стандартные изделия Ñòàíäàðòíûå èçäåëèÿ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.05.2009, 20:50:12 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
yncas wrote: > Есть текстовый файл в котором информация (кирилица + латиница) > представлена в 2х разных кодировках. Текстовые редакторы, такие как Такого не бывает. Иначе это не текстовый файл. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.05.2009, 21:57:26 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
MasterZiv Такого не бывает. Иначе это не текстовый файл. Хорошо не будем называть его текстовым. Есть некий файл в котором представлена текстовая информация в двух различных кодировках. Как их различить? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2009, 10:11:26 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
yncas, предлагаю читать файл по-битно и каждый бит конвертить из кодировки в UniCode. Вопрос как узнать какая именно кодировка у символа? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2009, 10:26:25 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
gdsyncas, предлагаю читать файл по-битно и каждый бит конвертить из кодировки в UniCode. Вопрос как узнать какая именно кодировка у символа? тонее по байтно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2009, 10:29:58 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
Посмотри на файлик в 16-ричном представлении. Возможно можно разделить по интервалу кодов. Читаешь строку (или слово), если все символы лежат в заданом интервале - одна кодировка, если есть смволы вне интервала - другая. Если один из них UniCode - то там на каждый символ два байта, младший из которых как правило одинаков для всех символов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2009, 10:48:20 |
|
||
|
Различные кодировки символов в одном файле
|
|||
|---|---|---|---|
|
#18+
yncas wrote: > Хорошо не будем называть его текстовым. Есть некий файл в котором > представлена текстовая информация в двух различных кодировках. Как их > различить? По сопроводительной нетекстовой информации, описывающей кодировку данных. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2009, 13:00:16 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=35998208&tid=1344461]: |
0ms |
get settings: |
8ms |
get forum list: |
17ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
208ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
54ms |
get tp. blocked users: |
2ms |
| others: | 227ms |
| total: | 534ms |

| 0 / 0 |
