Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ? / 5 сообщений из 5, страница 1 из 1
07.09.2016, 13:13
    #39305151
mihmih
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ?
Проблема:
На вход моего метода приходит строковый параметр вида:
/emailAddress=mihmig@company.ru/CN=\xD0\x9C\xD0\xB8\xD1\x85\xD0\xB0\xD0\xB8\xD0\xBB \xD0\xA1\xD0\xB5\xD1\x80\xD0\xB3\xD0\xB5\xD0\xB5\xD0\xB2\xD0\xB8\xD1\x87

(это DN из сертификата)
Как можно догадаться - это UTF-8 строка, неASCII-символы в которой заменены на шестнадцатеричные последовательности \xHH
Я догадался, что можно использовать метод javax.xml.bind.DatatypeConverter.parseHexBinary, но ему требуется чтоб ВСЯ строка состояла из таких последовательностей. А в моём случае - только кириллические символы закодированы в Hex.

Быть может есть библиотека/метод которая уже это делает?
...
Рейтинг: 0 / 0
08.09.2016, 23:56
    #39306221
Dmitry.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ?
ближайший декодер: URLDecoder если заменить все \х на %

Код: java
1.
2.
String s="/emailAddress=mihmig@company.ru/CN=\\xD0\\x9C\\xD0\\xB8\\xD1\\x85\\xD0\\xB0\\xD0\\xB8\\xD0\\xBB \\xD0\\xA1\\xD0\\xB5\\xD1\\x80\\xD0\\xB3\\xD0\\xB5\\xD0\\xB5\\xD0\\xB2\\xD0\\xB8\\xD1\\x87";
System.out.println( URLDecoder.decode(s.replaceAll("\\\\x","%"),"UTF-8") );



results

/emailAddress=mihmig@company.ru/CN=Михаил Сергеевич
...
Рейтинг: 0 / 0
09.09.2016, 10:47
    #39306428
lleming
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ?
Dmitry.ближайший декодер: URLDecoder если заменить все \х на %

Код: java
1.
2.
String s="/emailAddress=mihmig@company.ru/CN=\\xD0\\x9C\\xD0\\xB8\\xD1\\x85\\xD0\\xB0\\xD0\\xB8\\xD0\\xBB \\xD0\\xA1\\xD0\\xB5\\xD1\\x80\\xD0\\xB3\\xD0\\xB5\\xD0\\xB5\\xD0\\xB2\\xD0\\xB8\\xD1\\x87";
System.out.println( URLDecoder.decode(s.replaceAll("\\\\x","%"),"UTF-8") );



results

/emailAddress=mihmig@company.ru/CN=Михаил Сергеевич

вообще строго говоря это не слишком разумно. ибо URLEncode имеет свою специку, свои зарезервированные символы даже в rfc по hexadecimal entities если не ошибаюсь ничего не сказано.
URLEncode для работы с URL и там своя специка.
Наверняка на спецсимволах можно запороться.

Лучше уж разобраться почему такими приходят строки из источника и подобрать соотвествующее обратное преобразование.
...
Рейтинг: 0 / 0
09.09.2016, 10:50
    #39306430
lleming
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ?
Посмотреть надо в apache commons наверняка там есть что либо готовое.
...
Рейтинг: 0 / 0
09.09.2016, 11:44
    #39306485
mihmih
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ?
Спасибо ответившим, написал свой велосипед:
Код: java
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
import java.io.UnsupportedEncodingException;

public class SslClientDnDecoder {
	public static String decode(String ssl_client_s_dn) {
		byte[] bytes = ssl_client_s_dn.getBytes();
		byte b,bh,bl,bo;
		int i;
		int o = 0;
		int length = bytes.length;
		byte[] res = new byte[length]; // Промежуточный результат
		
		for (i=0; i<length; i++) {
			b = bytes[i];
			if ( b != 92) { // Не экранирующий обратный слеш - просто копируем байт
				 res[o] = b;
				 o++;
				 continue;
			}
			// конвертируем \xD0 -> -48 \x9A -> -102
			bh = bytes[i+2];
			bl = bytes[i+3];
			bo = (byte) (((bh>64) ? bh - 55 : bh - 48) * 16);
			bo += (byte) ((bl>64) ? bl - 55 : bl - 48);
			res[o] = bo;
			o++;
			i += 3;
		}
		byte[] result = new byte[o];
		System.arraycopy(res, 0, result, 0, o);
		try {
			String convertedString = new String(result, "UTF-8");
			return convertedString;
		} catch (UnsupportedEncodingException e) {
			return "";
		}
		
	}
	public static void main(String[] args) throws UnsupportedEncodingException {

		String ssl_client_s_dn = "/emailAddress=mihmig@company.ru/CN=\\xD0\\x9C\\xD0\\xB8\\xD1\\x85\\xD0\\xB0\\xD0\\xB8\\xD0\\xBB \\xD0\\xA1\\xD0\\xB5\\xD1\\x80\\xD0\\xB3\\xD0\\xB5\\xD0\\xB5\\xD0\\xB2\\xD0\\xB8\\xD1\\x87";
		System.out.println("Source string: " + ssl_client_s_dn);
		System.out.println("Decoded string: " + SslClientDnDecoder.decode(ssl_client_s_dn));
	}
}



Думаю что будет несколько быстрее чем через URLDecoder, т.к. нет лишних копирований строк...
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Что за кодировка \xD0\x9C\xD0\xB8\xD1\x85\ ? / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]