Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть? / 6 сообщений из 6, страница 1 из 1
01.06.2005, 16:41
    #33095494
shmuks
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
Нужно конвертить Cp1251 в UTF-8
buffer в 1215 - проверенно.

StringBuffer bufferUTF = new StringBuffer(new String(buffer.toString().getBytes("UTF-8")));

При конвертации почемуто символ "И" заменяет на ╨?.
jdk 1.4

Что делать?
...
Рейтинг: 0 / 0
01.06.2005, 16:47
    #33095527
wessen
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
Так а ведь строки в Java и так в UTF-8 хранятся.
...
Рейтинг: 0 / 0
01.06.2005, 16:56
    #33095554
Naug
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
/topic/183335&hl=

Только и там я не нашёл ответа.
...
Рейтинг: 0 / 0
01.06.2005, 18:00
    #33095735
NotGonnaGetUs
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
а кто такой buffer?
...
Рейтинг: 0 / 0
02.08.2005, 12:16
    #33196107
shmuks
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
Тема такая. Покапал я CharToByteCp1251,
там в таблице перекодировки пропущен код "И".

Свою проблему решил так, все конвертится отлично:

Читаем в нужной кодировке:

reader = new InputStreamReader(is, charset);
while ((size = reader.read(tmp, 0, tmp.length)) > 0) {
buffer.append(tmp, 0, size);
}


Пишем в нужной:

Writer writer = new OutputStreamWriter(new FileOutputStream("D:\\out.xml", false),"UTF-8");
writer.write(buffer.toString());
// writer.write(strUTF);
writer.flush();
writer.close();
...
Рейтинг: 0 / 0
02.08.2005, 12:33
    #33196188
funikovyuri
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть?
Код: plaintext
buffer.toString().getBytes("UTF-8"))

так вы ж его сначало в String преобразуете, а уже потом String в массив байтов... т.е. у вас ошибка в buffer.toString()
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Need help. Кодировки Cp1251->UTF-8 заменяет "И" на ? Как бороть? / 6 сообщений из 6, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]