|
|
|
windows-1251 to utf-8 неожиданная засада
|
|||
|---|---|---|---|
|
#18+
Приветствую. Помниться проделывал это без проблем, но достаточно давно, переехал на UTF-8, последнее время другого не пользовал. Собственно и jboss запускаю с опцией "file.encoding=UTF-8". А тут потребовалось закачать из файла данные построчно в БД, а он в 1251. Попробовал так (посоветовавшись с гуглем) Код: java 1. 2. 3. 4. 5. 6. 7. Не вышло, на выходе получил абракадабру. Почитал гугль, здесь поискал - вроде так и надо. Попробовал все кодировки вплоть до перебором в цикле, типа может не угадываю - результат нулевой, не читается. Попробовал символы почитать поштучно Код: java 1. 2. 3. На всех русских буквах выдаёт код 65533, гугль говорит, что это код для нераспознанного символа. Чешу репу - т.е. у меня из файла приходит строка сразу со всеми нераспознанными буквами? Ну т.е. конвертировать нечего? Ищу опять в гугле - вроде все так и делают, и главное у них получается, а у меня что-то клин. Какие то азы похоже упускаю. Просветите, плиз! Не, ну если конвертить файл в utf-8, то проблем понятно нет, так и сделал, но таких файлов ожидается вскоре во множестве, да и понять хочется. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.12.2015, 12:13 |
|
||
|
windows-1251 to utf-8 неожиданная засада
|
|||
|---|---|---|---|
|
#18+
AndreyDmtПопробовал так (посоветовавшись с гуглем) Код: java 1. Здесь стоило явно указать кодировку файла (cp1251?). Сейчас же у вас файл может быть в одной кодировке, а в этих конструкторах инициализируется чтения в -Dfile.encoding. Я бы на дефолтную кодировку не закладывался. AndreyDmt Код: java 1. Здесь у вас снова используется кодировка по-умолчаянию, которая UTF-8 и указали вы UTF-8. Итого имеем UTF-8 два раза. Как оно должно помочь в конвертировании из cp1251 ? AndreyDmtПочитал гугль, здесь поискал - вроде так и надо. Ну, не правда же. Я тут в каждой теме пишу что это кривой подход, чреватый потерей данных. Правильно указывать кодировку непосредственно там где она применима. Признаем что FileReader - кривой класс. Нам нужен InputStreamReader Код: java 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.12.2015, 12:39 |
|
||
|
windows-1251 to utf-8 неожиданная засада
|
|||
|---|---|---|---|
|
#18+
AndreyDmt, Ну, ещё и памятка: https://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.12.2015, 12:41 |
|
||
|
|

start [/forum/topic.php?fid=59&tid=2124606]: |
0ms |
get settings: |
10ms |
get forum list: |
18ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
31ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
40ms |
get tp. blocked users: |
1ms |
| others: | 261ms |
| total: | 380ms |

| 0 / 0 |
