powered by simpleCommunicator - 2.0.30     © 2024 Programmizd 02
Map
Форумы / Java [игнор отключен] [закрыт для гостей] / Подскажите как на Java превратить "кракозябры" обратно в русский текст
53 сообщений из 53, показаны все 3 страниц
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40036975
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Так вот

Исходная строка:
Код: plaintext
Ошибка валидации атрибутов документа

Здесь её указать сложно, поскольку после публикации сообщения выглядеть она может уже по-другому. А прикладывать картинки запрещено работодателем.
Поэтому прикладываю строку в виде массива, полученного с помощью String.getBytes():
C3 90 C2 9E C3 91 C2 88 C3 90 C2 B8 C3 90 C2 B1 C3 90 C2 BA C3 90 C2 B0 20 C3 90 C2 B2 C3 90 C2 B0 C3 90 C2 BB C3 90 C2 B8 C3 90 C2 B4 C3 90 C2 B0 C3 91 C2 86 C3 90 C2 B8 C3 90 C2 B8 20 C3 90 C2 B0 C3 91 C2 82 C3 91 C2 80 C3 90 C2 B8 C3 90 C2 B1 C3 91 C2 83 C3 91 C2 82 C3 90 C2 BE C3 90 C2 B2 20 C3 90 C2 B4 C3 90 C2 BE C3 90 C2 BA C3 91 C2 83 C3 90 C2 BC C3 90 C2 B5 C3 90 C2 BD C3 91 C2 82 C3 90 C2 B0

На самом же деле это текст "Ошибка валидации атрибутов документа", неверно преобразованный из кодировки CP1251 в UTF.

Подскажите, пожалуйста, как на Java преобразовать исходную строку в русский текст (т.е. реанимировать)?

На JavaScript это можно сделать так:
Код: javascript
1.
decodeURIComponent(escape(x))

где x - переменная, содержащая исходную строку.

Спасибо
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40036987
Фотография Dmitry.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Код: java
1.
2.
String s = "тут та хрень из вопроса";
s = new String(s.getBytes("cp1252"), "utf-8");



но скорее всего ты либо пишешь либо читаешь байты некорректно
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037032
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dmitry.,

если делаю, как ты сказал, получаю вопросы:
Код: java
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
        String s0 = "Ошибка валидации атрибутов документа";
        System.out.println("s0=\"" + s0 + "\"");
        byte[] bytes1251 = s0.getBytes("CP1251");
        System.out.println("s0.bytes1251=" + bytesToHex(bytes1251, 0, bytes1251.length));
        byte[] bytesUTF8 = s0.getBytes("UTF-8");
        System.out.println("s0.bytesUTF8=" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));
        System.out.println();

        String s1 = "Ð\u009Eшибка валидации атрибутов документа";
        System.out.println("s1=\"" + s1 + "\"");
        bytes1251 = s1.getBytes("CP1251");
        System.out.println("s1.bytes1251=" + bytesToHex(bytes1251, 0, bytes1251.length));
        bytesUTF8 = s1.getBytes("UTF-8");
        System.out.println("s1.bytesUTF8=" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));
        System.out.println();

        String s2 = new String(s1.getBytes("CP1251"), "UTF-8");
        System.out.println("s2=\"" + s2 + "\"");
        bytes1251 = s2.getBytes("CP1251");
        System.out.println("s2.bytes1251=" + bytesToHex(bytes1251, 0, bytes1251.length));
        bytesUTF8 = s2.getBytes("UTF-8");
        System.out.println("s2.bytesUTF8=" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));


Результат:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
s0="Ошибка валидации атрибутов документа"
s0.bytes1251=CE F8 E8 E1 EA E0 20 E2 E0 EB E8 E4 E0 F6 E8 E8 20 E0 F2 F0 E8 E1 F3 F2 EE E2 20 E4 EE EA F3 EC E5 ED F2 E0
s0.bytesUTF8=D0 9E D1 88 D0 B8 D0 B1 D0 BA D0 B0 20 D0 B2 D0 B0 D0 BB D0 B8 D0 B4 D0 B0 D1 86 D0 B8 D0 B8 20 D0 B0 D1 82 D1 80 D0 B8 D0 B1 D1 83 D1 82 D0 BE D0 B2 20 D0 B4 D0 BE D0 BA D1 83 D0 BC D0 B5 D0 BD D1 82 D0 B0

s1="Ошибка валидации атрибутов документа"
s1.bytes1251=3F 3F 3F 3F 3F 3F 3F B1 3F 3F 3F B0 20 3F 3F 3F B0 3F BB 3F 3F 3F 3F 3F B0 3F 3F 3F 3F 3F 3F 20 3F B0 3F 3F 3F 3F 3F 3F 3F B1 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F B5 3F 3F 3F 3F 3F B0
s1.bytesUTF8=C3 90 C2 9E C3 91 C2 88 C3 90 C2 B8 C3 90 C2 B1 C3 90 C2 BA C3 90 C2 B0 20 C3 90 C2 B2 C3 90 C2 B0 C3 90 C2 BB C3 90 C2 B8 C3 90 C2 B4 C3 90 C2 B0 C3 91 C2 86 C3 90 C2 B8 C3 90 C2 B8 20 C3 90 C2 B0 C3 91 C2 82 C3 91 C2 80 C3 90 C2 B8 C3 90 C2 B1 C3 91 C2 83 C3 91 C2 82 C3 90 C2 BE C3 90 C2 B2 20 C3 90 C2 B4 C3 90 C2 BE C3 90 C2 BA C3 91 C2 83 C3 90 C2 BC C3 90 C2 B5 C3 90 C2 BD C3 91 C2 82 C3 90 C2 B0

s2="???????�???� ???�?�?????�?????? ?�???????�???????? ???????????�?????�"
s2.bytes1251=3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F
s2.bytesUTF8=3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F EF BF BD 20 3F 3F 3F EF BF BD 3F EF BF BD 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F 3F 20 3F EF BF BD 3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F EF BF BD
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037038
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--,

Дай полный код примера на JS или Java
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037065
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp,

прошу прощения, но куда полнее?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037066
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
PetroNotC Sharp,

прошу прощения, но куда полнее?

Прошу прощения, раз вы с вопросом, то вы не можете оценивать вопросы врача.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037099
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--,

я так понимаю что ожидалась кириллица?

Скажи какая первая буква должна была быть. И мы попробуем угадать сколько damage ты нанёс
русским буквам пока скачивал и еще копи-пастил через клипборд.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037110
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

ну как же, строка s0 = "Ошибка валидации атрибутов документа".
ее первая буква = "О".
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037113
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
mayton,

ну как же, строка s0 = "Ошибка валидации атрибутов документа".
ее первая буква = "О".
ну и где вторая строка в байты, третья в лог, четвертая обратно в слова и пятая в лог?
Упрямый вы наш
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037117
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--, ты когда написал decodeURIComponent - ты только еще больше запутал читающих.

Если с getBytes все ясно. То decodeURIComponent делает вообще другое. И предназначено для других задач.

Код кириллической русской буквы "O" в Java строке - 0x041E

Где у тебя в твоих экспериментах хотя-бы одна binhex последовательность содержащая байты 04 и 1e ?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037120
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А это што? Если выписать твои байты в столбик. То в них есть характерные группы по 4 символа + пробельчик иногда.

Код: java
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
C3 90 C2 9E 
C3 91 C2 88 
C3 90 C2 B8 
C3 90 C2 B1 
C3 90 C2 BA 
C3 90 C2 B0 20 
C3 90 C2 B2 
C3 90 C2 B0 
C3 90 C2 BB 
C3 90 C2 B8 
C3 90 C2 B4 
C3 90 C2 B0 
C3 91 C2 86 
C3 90 C2 B8 
C3 90 C2 B8 20 
C3 90 C2 B0 
C3 91 C2 82 
C3 91 C2 80 
C3 90 C2 B8 
C3 90 C2 B1 
C3 91 C2 83 
C3 91 C2 82 
C3 90 C2 BE 
C3 90 C2 B2 20 
C3 90 C2 B4 
C3 90 C2 BE 
C3 90 C2 BA 
C3 91 C2 83 
C3 90 C2 BC 
C3 90 C2 B5 
C3 90 C2 BD 
C3 91 C2 82 
C3 90 C2 B0
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037121
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот такая вводная господа. Симметричная криптография типа подстановочного шифра.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037124
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

Пусть делает "мама мыла раму" туда сюда
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037142
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

Код: java
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
        String s0 = "Ошибка валидации атрибутов документа";
        System.out.println("s0=\"" + s0 + "\"");
        byte[] bytes1251 = s0.getBytes("CP1251");
        System.out.println("s0.bytes1251 =" + bytesToHex(bytes1251, 0, bytes1251.length));
        byte[] bytesUTF8 = s0.getBytes("UTF-8");
        System.out.println("s0.bytesUTF8 =" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));
        byte[] bytesUTF16 = s0.getBytes("UTF-16");
        System.out.println("s0.bytesUTF16=" + bytesToHex(bytesUTF16, 0, bytesUTF16.length));
        System.out.println();

        String s1 = "Ð\u009Eшибка валидации атрибутов документа";
        System.out.println("s1=\"" + s1 + "\"");
        bytes1251 = s1.getBytes("CP1251");
        System.out.println("s1.bytes1251 =" + bytesToHex(bytes1251, 0, bytes1251.length));
        bytesUTF8 = s1.getBytes("UTF-8");
        System.out.println("s1.bytesUTF8 =" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));
        bytesUTF16 = s1.getBytes("UTF-16");
        System.out.println("s1.bytesUTF16=" + bytesToHex(bytesUTF16, 0, bytesUTF16.length));
        System.out.println();

        String s2 = new String(s1.getBytes("CP1251"), "UTF-8");
        System.out.println("s2=\"" + s2 + "\"");
        bytes1251 = s2.getBytes("CP1251");
        System.out.println("s2.bytes1251 =" + bytesToHex(bytes1251, 0, bytes1251.length));
        bytesUTF8 = s2.getBytes("UTF-8");
        System.out.println("s2.bytesUTF8 =" + bytesToHex(bytesUTF8, 0, bytesUTF8.length));
        bytesUTF16 = s2.getBytes("UTF-16");
        System.out.println("s2.bytesUTF16=" + bytesToHex(bytesUTF16, 0, bytesUTF16.length));


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
s0="Ошибка валидации атрибутов документа"
s0.bytes1251 =CE F8 E8 E1 EA E0 20 E2 E0 EB E8 E4 E0 F6 E8 E8 20 E0 F2 F0 E8 E1 F3 F2 EE E2 20 E4 EE EA F3 EC E5 ED F2 E0
s0.bytesUTF8 =D0 9E D1 88 D0 B8 D0 B1 D0 BA D0 B0 20 D0 B2 D0 B0 D0 BB D0 B8 D0 B4 D0 B0 D1 86 D0 B8 D0 B8 20 D0 B0 D1 82 D1 80 D0 B8 D0 B1 D1 83 D1 82 D0 BE D0 B2 20 D0 B4 D0 BE D0 BA D1 83 D0 BC D0 B5 D0 BD D1 82 D0 B0
s0.bytesUTF16=FE FF 04 1E 04 48 04 38 04 31 04 3A 04 30 00 20 04 32 04 30 04 3B 04 38 04 34 04 30 04 46 04 38 04 38 00 20 04 30 04 42 04 40 04 38 04 31 04 43 04 42 04 3E 04 32 00 20 04 34 04 3E 04 3A 04 43 04 3C 04 35 04 3D 04 42 04 30

s1="Ошибка валидации атрибутов документа"
s1.bytes1251 =3F 3F 3F 3F 3F 3F 3F B1 3F 3F 3F B0 20 3F 3F 3F B0 3F BB 3F 3F 3F 3F 3F B0 3F 3F 3F 3F 3F 3F 20 3F B0 3F 3F 3F 3F 3F 3F 3F B1 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F B5 3F 3F 3F 3F 3F B0
s1.bytesUTF8 =C3 90 C2 9E C3 91 C2 88 C3 90 C2 B8 C3 90 C2 B1 C3 90 C2 BA C3 90 C2 B0 20 C3 90 C2 B2 C3 90 C2 B0 C3 90 C2 BB C3 90 C2 B8 C3 90 C2 B4 C3 90 C2 B0 C3 91 C2 86 C3 90 C2 B8 C3 90 C2 B8 20 C3 90 C2 B0 C3 91 C2 82 C3 91 C2 80 C3 90 C2 B8 C3 90 C2 B1 C3 91 C2 83 C3 91 C2 82 C3 90 C2 BE C3 90 C2 B2 20 C3 90 C2 B4 C3 90 C2 BE C3 90 C2 BA C3 91 C2 83 C3 90 C2 BC C3 90 C2 B5 C3 90 C2 BD C3 91 C2 82 C3 90 C2 B0
s1.bytesUTF16=FE FF 00 D0 00 9E 00 D1 00 88 00 D0 00 B8 00 D0 00 B1 00 D0 00 BA 00 D0 00 B0 00 20 00 D0 00 B2 00 D0 00 B0 00 D0 00 BB 00 D0 00 B8 00 D0 00 B4 00 D0 00 B0 00 D1 00 86 00 D0 00 B8 00 D0 00 B8 00 20 00 D0 00 B0 00 D1 00 82 00 D1 00 80 00 D0 00 B8 00 D0 00 B1 00 D1 00 83 00 D1 00 82 00 D0 00 BE 00 D0 00 B2 00 20 00 D0 00 B4 00 D0 00 BE 00 D0 00 BA 00 D1 00 83 00 D0 00 BC 00 D0 00 B5 00 D0 00 BD 00 D1 00 82 00 D0 00 B0

s2="???????�???� ???�?�?????�?????? ?�???????�???????? ???????????�?????�"
s2.bytes1251 =3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F
s2.bytesUTF8 =3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F EF BF BD 20 3F 3F 3F EF BF BD 3F EF BF BD 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F 3F 20 3F EF BF BD 3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F 3F 3F 3F 20 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F 3F EF BF BD 3F 3F 3F 3F 3F EF BF BD
s2.bytesUTF16=FE FF 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F FF FD 00 3F 00 3F 00 3F FF FD 00 20 00 3F 00 3F 00 3F FF FD 00 3F FF FD 00 3F 00 3F 00 3F 00 3F 00 3F FF FD 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 20 00 3F FF FD 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F FF FD 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 20 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F 00 3F FF FD 00 3F 00 3F 00 3F 00 3F 00 3F FF FD
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037147
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

Ну он перекодировал в китайскую кодировку в app1 и теперь спрашивает как вернуть в app2
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037149
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Мужик едет в поезде. Достает бананы, посыпает их солью - и выбрасывает в окно. Посыпает - выбрасывает. И так постоянно. Сосед не выдерживает и спрашивает:

- Мужик, ты зачем это делаешь?
- Просто не люблю солёные бананы.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037161
lleming
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
где то в онлайн был конвертер который мог "догадаться" какая оригинальная кодировка была в строке. Можно было выдернуть обе кодировки, оригинальную и использованую для испорченья и попробовать обратить время кодировку вспять.
Действует не всех случаях а где без потери только.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037164
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
(раскачиваясь в кресле)

Давайте подумем, какое преобразование сохраняет пробел как символ пробел а кириллицу - учетверяет.

Предположительно это может быть какое-то веб-экранирование типа URL encoding или ASCII и после этого
еще одно с кодировкой.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037166
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lleming, конвертер Лебедева не догадался пока.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037168
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lleming,

Возможно, вы об этом: Универсальный декодер
исходная кодировка : WINDOWS-1251
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037169
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Давайте подумем, какое преобразование сохраняет пробел как символ пробел а кириллицу - учетверяет.


UTF8 cast to CP1251 --> convert to UTF8 (удваиваем), cast to CP1251 -> convert to UTF8 (учетверяем)


String s = "тут та хрень из вопроса";
s = new String(s.getBytes("cp1252"), "utf-8");


Смысл преобразования из String в String через getBytes и new String - мне совершенно не понятна

Кодировку сорцов в настройках проекта корректно указать религия (если мазохизм можно назвать религией) не позволяет?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037172
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Давайте подумем, какое преобразование сохраняет пробел как символ пробел а кириллицу - учетверяет
Ради чего? Кириллическое представление строки я указал только ради того, чтобы было понятно, в какую сторону копать. Это совершенно не означает, что это *исходная* строка.
В данном случае мне нужно сделать переводчик с "кракозябр" на русский, а не наоборот.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037174
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev
Кодировку сорцов
Код: xml
1.
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037175
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--,

>В данном случае мне нужно сделать переводчик с "кракозябр" на русский, а не наоборот.
Нужен источник крякозябр
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037177
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
Нужен источник крякозябр
Универсальному декодеру источник не нужен. Кроме того, как я указал в первом посте, с помощью JavaScript это делается просто:
Код: plaintext
decodeURIComponent(escape(x))
Я же спрашиваю как это сделать на Java.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037179
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
PetroNotC Sharp
Нужен источник крякозябр
Универсальному декодеру источник не нужен. Кроме того, как я указал в первом посте, с помощью JavaScript это делается просто:
Код: plaintext
decodeURIComponent(escape(x))
Я же спрашиваю как это сделать на Java.

Так же и сделать.
URI декодер в состав базовых классов входит. Как минимум можно еще в Google Utils посмотреть.

В первом вопросе, было совершенно о другом. О неправильной кодировке, а не о расшифровке URI.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037180
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev,

+1 это совсем разные методы и смыслы преобразования
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037181
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev
Так же и сделать
Как именно? Будьте добры, предоставьте пример кода (по возможности, без использования движка JavaScript). Спасибо
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037183
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
Leonid Kudryavtsev
Так же и сделать
Как именно? Будьте добры, предоставьте пример кода (по возможности, без использования движка JavaScript). Спасибо
Uri class java?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037184
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вас в гугле персонально забанили или это РосПотребНадзор с блокировками развлекается ? Просто интересно, до меня пока еще блокировки не докатились, гугле работает

https://stackoverflow.com/questions/6138127/how-to-do-url-decoding-in-java

java.net.URLDecoder.decode
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037188
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
(раскачиваясь в кресле)

Давайте подумем, какое преобразование сохраняет пробел как символ пробел а кириллицу - учетверяет.

Предположительно это может быть какое-то веб-экранирование типа URL encoding или ASCII и после этого
еще одно с кодировкой.
если Uri то это маскирование запрещенных.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037189
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev
https://stackoverflow.com/questions/6138127/how-to-do-url-decoding-in-java
Благодарю, но вы так и не предоставили кода, достоверно конвертирующего строку, предоставленную мною в первом посте (из кракозябр), в кириллический текст.
Либо сделайте это, либо так и скажите, что не сможете.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037191
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton

и после этого еще одно с кодировкой

В URI декодер можно/нужно передавать кодировку. Скорее всего она приходит в заголовке HTTP запроса. Но тут уже не помню, давно таким не занимался, в последние десяток лет, редко когда требовалось URI руками создавать/парсить. Сейчас этим достаточно успешно фраймворки и Web-либы сами занимаются (исключения бывают, но все же достаточно редко).
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037192
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
Leonid Kudryavtsev
https://stackoverflow.com/questions/6138127/how-to-do-url-decoding-in-java
Благодарю, но вы так и не предоставили кода, достоверно конвертирующего строку, предоставленную мною в первом посте (из кракозябр), в кириллический текст.
Либо сделайте это, либо так и скажите, что не сможете.

Слушай ну ты реально бездельник

Вот дядечка Баелдунх даже примеры написал https://www.baeldung.com/java-url-encoding-decoding

Пробуй.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037194
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
Leonid Kudryavtsev
https://stackoverflow.com/questions/6138127/how-to-do-url-decoding-in-java
Благодарю, но вы так и не предоставили кода, достоверно конвертирующего строку, предоставленную мною в первом посте (из кракозябр), в кириллический текст.
Либо сделайте это, либо так и скажите, что не сможете.


5 000 руб прислать готовы. Напишите Ваш e-mail, вышлю номер карточки. Не хочу светить в Инете.

Днем деньги, через час код.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037195
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,
>Слушай ну ты реально бездельник
)))
14 лет челу.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037196
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev
mayton

и после этого еще одно с кодировкой

В URI декодер можно/нужно передавать кодировку. Скорее всего она приходит в заголовке HTTP запроса. Но тут уже не помню, давно таким не занимался, в последние десяток лет, редко когда требовалось URI руками создавать/парсить. Сейчас этим достаточно успешно фраймворки и Web-либы сами занимаются (исключения бывают, но все же достаточно редко).

+1

Я кстати заметил что проблемы обычно на том проекте - где национальная кодировка пролезает за границу базы данных
и дальше лезет в веб. И если в БД есть рациональное зерно (мы обсуждали уже где-то) хранит 1-байтные строки
то на других уровнях - только сломанный UI и куча технического долга.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037197
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
mayton,
>Слушай ну ты реально бездельник
)))
14 лет челу.

В 14 лет мы с другом писали игру на ZX-Spectrum.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037200
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
примеры
Пожалуйста, укажите пример, которым я смогу воспользоваться для того, чтобы конвертировать строку "Ошибка валидации атрибутов документа" в кириллицу
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037202
DHDD
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
--Eugene--,

"URL" тоже самое...
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037216
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
mayton
примеры
Пожалуйста, укажите пример, которым я смогу воспользоваться для того, чтобы конвертировать строку "Ошибка валидации атрибутов документа" в кириллицу

Я - пас. Я - как Платон. Задаю встречные вопросы. А люди уже сами на них ответят. Тебе в топике уже
достатоно пищи для размышлений дали.

Не получится ничего - ну сделай свой декодер. По байтам. Табличку я привел. 4 байта - буква. Пробел == пробел. С богом...
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037222
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
mayton
примеры
Пожалуйста, укажите пример, которым я смогу воспользоваться для того, чтобы конвертировать строку "Ошибка валидации атрибутов документа" в кириллицу
На этом форуме не получается передать строку в исходном виде - после публикации сообщения некоторые символы теряются, некоторые меняются на другие.
Однако, я уже выкладывал ее побайтово в шестнадцатеричном представлении.
\xD0\x9E\xD1\x88\xD0\xB8\xD0\xB1\xD0\xBA\xD0\xB0\x20\xD0\xB2\xD0\xB0\xD0\xBB\xD0\xB8\xD0\xB4\xD0\xB0\xD1\x86\xD0\xB8\xD0\xB8\x20\xD0\xB0\xD1\x82\xD1\x80\xD0\xB8\xD0\xB1\xD1\x83\xD1\x82\xD0\xBE\xD0\xB2\x20\xD0\xB4\xD0\xBE\xD0\xBA\xD1\x83\xD0\xBC\xD0\xB5\xD0\xBD\xD1\x82\xD0\xB0

Эта строка вполне переводится в осознанную кириллицу на сайте 0xcc.net , если её вставить в поле \xXX
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037223
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Я - пас
Ну вот сразу бы так.
Чем разводить пафосный треп о том, кто во сколько лет что на чем писал.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037227
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
mayton
Я - пас
Ну вот сразу бы так.
Чем разводить пафосный треп о том, кто во сколько лет что на чем писал.
ты правда подумал что ветка форума для тебя именно?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037238
DHDD
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.nio.charset.StandardCharsets;

public class HelloWorld{
public static void main(String []args){
String s1 = "Ошибка валидации атрибутов документа";
try{
String res = new String(s1.getBytes("Windows-1252"), "UTF-8");
System.out.println(res);
}
catch(Exception e){
System.out.println("exception :(");
}
}
}

Result (https://www.tutorialspoint.com/compile_java_online.php)
$javac HelloWorld.java
$java -Xmx128M -Xms16M HelloWorld
Ошибка валидации атрибутов документа
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037249
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DHDD
getBytes("Windows-125 2 ")
СПАСИБО!
Но как вы поняли?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037251
DHDD
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
--Eugene--,

online потестил разные кодировки.
1251 выдаёт кракозябры, 1252 норм.
(код не отформатирован - форум конвертирует строку s1)
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037255
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DHDD,

однако, поспешил я радоваться..
не надо было вообще здесь строки выкладывать, поскольку форум их коверкает.
1252 подходит лишь отчасти)

вот еще одна строка, в хексе (специально для 0xcc.net):
\xC3\x90\xC2\x94\xC3\x90\xC2\xBE\xC3\x90\xC2\xBA\xC3\x91\xC2\x83\xC3\x90\xC2\xBC\xC3\x90\xC2\xB5\xC3\x90\xC2\xBD\xC3\x91\xC2\x82\x20\xC3\x90\xC2\xB7\xC3\x90\xC2\xB0\xC3\x91\xC2\x80\xC3\x90\xC2\xB5\xC3\x90\xC2\xB3\xC3\x90\xC2\xB8\xC3\x91\xC2\x81\xC3\x91\xC2\x82\xC3\x91\xC2\x80\xC3\x90\xC2\xB8\xC3\x91\xC2\x80\xC3\x90\xC2\xBE\xC3\x90\xC2\xB2\xC3\x90\xC2\xB0\xC3\x90\xC2\xBD
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037257
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ответили на stackoverflow.com .
Как оказалось, кодировка ISO_8859_1 помогла! :)
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037259
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну ты и пакостник Зачем дискуссию поднимал тут?
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037274
Фотография --Eugene--
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Зачем дискуссию поднимал тут?
Не знаю на что я надеялся. Возможно, на вменяемость местных.
Но им лишь бы порисоваться, увы
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037362
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Конечно, что же ещё делать, если в ISO-8859- 1 кирилицы - прямо вагон и маленькая тележка.
...
Рейтинг: 0 / 0
Подскажите как на Java превратить "кракозябры" обратно в русский текст
    #40037371
lleming
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
--Eugene--
lleming,

Возможно, вы об этом: Универсальный декодер
исходная кодировка : WINDOWS-1251


ага оно
...
Рейтинг: 0 / 0
53 сообщений из 53, показаны все 3 страниц
Форумы / Java [игнор отключен] [закрыт для гостей] / Подскажите как на Java превратить "кракозябры" обратно в русский текст
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]