Зашился в кодировках / Java

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Java [игнор отключен] [закрыт для гостей] / Зашился в кодировках

8 сообщений из 8, страница 1 из 1

Зашился в кодировках

#34101481

vladik_k

Участник

Сообщения: 61

Рейтинг: 0 / 0

В винде в блокноте (кодировка Ср1251) описываю класс в котором есть строчки:

String err = "Ошибка!";
...
System.out.println(err); - в Command Promt видны вывело кракозябру :)

тогда я пошел другим путем и написал:

byte[] bErr = err.getBytes();
System.out.println("Cp1251 = "+new String(bErr, "Cp1251")); - вывело туже самую кракозябру, один в один

подставлял другие кодовые страницы (Cp866, UTF-8, UTF-16, US-ASCII) - таже хрень

что посоветуете?

...

Рейтинг:

0 / 0

02.11.2006, 16:01:53

| Ответить | Цитировать | Написать

Зашился в кодировках

#34101872

expp

Участник

Откуда: spb now

Сообщения: 1 247

Рейтинг: 0 / 0

nativetoascii

...

Рейтинг:

0 / 0

02.11.2006, 17:31:48

| Ответить | Цитировать | Написать

Зашился в кодировках

#34102103

Lennier

Участник

Откуда: Москва

Сообщения: 79

Рейтинг: 0 / 0

Что мешает сохранить в блокноте с кодировкой UTF-8?

...

Рейтинг:

0 / 0

02.11.2006, 18:34:41

| Ответить | Цитировать | Написать

Зашился в кодировках

#34102829

ponomarevvb

Участник

Сообщения: 365

Рейтинг: 0 / 0

Эхе-хе

String#getBytes():
API doc
Encodes this String into a sequence of bytes using the platform's default charset, storing the result into a new byte array.

Теперь о том, когда и как происходят преобразования символов.
Первый раз - когда исходник необходимо перевести в байт-код, где все символы хранятся в Юникоде. Для этого необходимо знать кодировку исходника, для Винды по умолчанию считается cp866.
Второй раз символы преобразуются при выводе на консоль - Юникод из байт-кода должен быть преобразован в кодировку, которая используется в консоли.

Наверное, лучший способ контролировать этот процесс - указывать кодировку явно и при компиляции и при запуске JVM. Для компиляции можно этого избежать, если писать строки сразу в Юникоде, в форме "\uXXXX".

При компиляции: javac -encoding кодировка YourClass.java
При выполнении: java -Dfile.encoding=кодировка YourClass

Ну, и как пример, смотрите аттач.
Компиляция:
1. javac -encoding cp1251 Test.java
2. javac -encoding cp866 Test.java

Выполнение (для обоих случаев):
java -Dfile.encoding=cp866 Test

Наслаждайтесь

...

Рейтинг:

0 / 0

03.11.2006, 09:21:33

| Ответить | Цитировать | Написать

Зашился в кодировках

#34102881

danii

Участник

Откуда: Воронеж

Сообщения: 65

Рейтинг: 0 / 0

1.для окна коммандного процессора устанавливаем шрифт Lucinda Console
свойства -> шрифт,
2.выплняет команду chcp 1251
3.System.out.println("теперь мы видим русские буквы");

...

Рейтинг:

0 / 0

03.11.2006, 09:39:48

| Ответить | Цитировать | Написать

Зашился в кодировках

#34105703

vladik_k

Участник

Сообщения: 61

Рейтинг: 0 / 0

danii1.для окна коммандного процессора устанавливаем шрифт Lucinda Console
свойства -> шрифт,
2.выплняет команду chcp 1251
3.System.out.println("теперь мы видим русские буквы");

Спасибо! Это работает!
Только не до конца доганаяю - как?!

Поправьте меня (пишу немного утрированно, предполагаем, что под код символа выделяется один байт):
1. текст проги я набираю в кодировке "Ср1251"
2. при компиляции, компилятор все переводит в кодировку "Юникод", т.е. если при наборе проги, числовому значению (байту со значением) 145 в кодировке "Ср1251", пишу от фанаря, ставится в соответствие символ "а", то компилятор отыщет в таблице "Юникода" символ "а" и сопоставит ему новое числовое значение, допустим, 215? Или числовое значение 145 так и останется, только Java использая таблицу кодов "Юникод" будет ставить ему в соответствие другой символ?
3. при выводе, Java в выходной поток будет выдавать байт со значением 145 или 215?
4. интерпритирующая среда, в моем случае, это Command Promt винды, полученный байт будет интерпретировать в соответствии со своей кодовой страницей, которая может отличаться от кодовой страницы системы (винды)?

И еще вопрос: почему недостаточно выполнить только команду chcp 1251, а надо еще и шрифт Lucinda Console выбрать?

...

Рейтинг:

0 / 0

04.11.2006, 15:43:52

| Ответить | Цитировать | Написать

Зашился в кодировках

#34110890

vladik_k

Участник

Сообщения: 61

Рейтинг: 0 / 0

vladik_k danii1.для окна коммандного процессора устанавливаем шрифт Lucinda Console
свойства -> шрифт,
2.выплняет команду chcp 1251
3.System.out.println("теперь мы видим русские буквы");

Спасибо! Это работает!
Только не до конца доганаяю - как?!

Поправьте меня (пишу немного утрированно, предполагаем, что под код символа выделяется один байт):
1. текст проги я набираю в кодировке "Ср1251"
2. при компиляции, компилятор все переводит в кодировку "Юникод", т.е. если при наборе проги, числовому значению (байту со значением) 145 в кодировке "Ср1251", пишу от фанаря, ставится в соответствие символ "а", то компилятор отыщет в таблице "Юникода" символ "а" и сопоставит ему новое числовое значение, допустим, 215? Или числовое значение 145 так и останется, только Java использая таблицу кодов "Юникод" будет ставить ему в соответствие другой символ?
3. при выводе, Java в выходной поток будет выдавать байт со значением 145 или 215?
4. интерпритирующая среда, в моем случае, это Command Promt винды, полученный байт будет интерпретировать в соответствии со своей кодовой страницей, которая может отличаться от кодовой страницы системы (винды)?

И еще вопрос: почему недостаточно выполнить только команду chcp 1251, а надо еще и шрифт Lucinda Console выбрать?

люди, разъясните пожалуйста

...

Рейтинг:

0 / 0

08.11.2006, 09:16:12

| Ответить | Цитировать | Написать

Зашился в кодировках

#34115819

mysterio

Участник

Откуда: Долгопрудный, МО

Сообщения: 399

Рейтинг: 0 / 0

Не ожидал, что с такой простой проблемой народ будет так долго разбираться.
Подсказка: многие врапперы потоков в java.io.* имеют в конструкторах параметр-кодировку.
Например, PrintWriter или OutputStreamWriter.

...

Рейтинг:

0 / 0

09.11.2006, 13:39:31

| Ответить | Цитировать | Написать

8 сообщений из 8, страница 1 из 1

Форумы / Java [игнор отключен] [закрыт для гостей] / Зашился в кодировках

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=59&fpage=684&tid=2147544]:	0ms
get settings:	8ms
get forum list:	16ms
check forum access:	3ms
check topic access:	3ms
track hit:	49ms
get topic data:	10ms
get forum data:	2ms
get page messages:	52ms
get tp. blocked users:	1ms
others:	297ms

total:	441ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы