powered by simpleCommunicator - 2.0.58     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / MSVC и GCC: совместимость кодировок исходников
25 сообщений из 409, страница 12 из 17
MSVC и GCC: совместимость кодировок исходников
    #39896969
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Удивляют меня такие заявления от человека для которого нужно написать целую страницу комментов, что бы он понял как работает std::mblen()

Ну протормозил немного, что сразу ржать?
1. GUI это не современная жизнь?
Гуи - это помойка, которую переписывали и будут переписывать каждые лет 5 максимум.
Мы обсуждаем именно офисный софт не завязанный на сложную лингвистику.
Мы обсуждаем то, как кто-то не смог быстро захардкодить utf8 как в жс/жабке/etc и рассказывает, какие плюсы плохие.
PS: А ты в какой области разработки ПО работаешь? Плиз: языки программирования и предметная область.
Бекенд жабка/жс/оракл для ЖКХ.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39896971
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Ты смотрел на сигнатуру функции и сделал такое предположение, что само существование этой функции становилось абсурдом.

Я недооценил любовь плюсовиков к великам и подумал, что она mb_strlen.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39896974
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav,

Ты там что-то грозился насчёт js, ну так что, когда?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39896976
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
petrav,

Ты там что-то грозился насчёт js, ну так что, когда?

Извини, я подзабыл, что я там на счёт js грозился?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39896978
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Извини, я подзабыл, что я там на счёт js грозился?


Ну как так можно!

petrav
Если ты хочешь начать срач и модератор разрешит: через несколько постов тебе станет крайне обидно за себя.


Я же жду, надеюсь, аргументы придумываю.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39896995
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster

1. GUI это не современная жизнь?

Гуи - это помойка, которую переписывали и будут переписывать каждые лет 5 максимум.
Ну я видел промышленный софт, который работает десятилетиями. Хотя, конечно, ядро ОС разрабатывать круче.

crutchmaster

Мы обсуждаем именно офисный софт не завязанный на сложную лингвистику.

Мы обсуждаем то, как кто-то не смог быстро захардкодить utf8 как в жс/жабке/etc и рассказывает, какие плюсы плохие.
Ты действительно думаешь, что мне сложно подключить ICU? Вот перебрать кучу исходников, доработать их, перетестировать, объяснить окружающим зачем это надо, почему я их напрягаю и умудриться ещё и зарплату за это получить - да это сложно. Если знаешь быстрый способ - подскажи.

А плюсы тут да, плохие. Потому что не поддерживают на уровне языка работу с utf-8.

crutchmaster

PS: А ты в какой области разработки ПО работаешь? Плиз: языки программирования и предметная область.

Бекенд жабка/жс/оракл для ЖКХ.
У тебя точно такая же прикладная отрасль как у меня. Я тоже могу сказать, что из-за специфики твоей работы БД твоя не нормализирована, в софте твоём куча костылей под временные-сиюминутные требования заказчика, которые нужно сделать быстро. Через пять лет проект твоей компании упадёт под собственной тяжестью и вам придётся его переписывать. Вы начнёте проектировать новое ядро своего приложения, максимально гибкое, но через пять лет там снова будет помойка из костылей. Ява станет непопулярной и вы будете переписывать всё на Go 3.0. А потом Гуглы положат на язык Го.

И ты пойдешь разрабатывать промышленный софт на десятилетия. И не будешь подключать ICU.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897001
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Ну я видел промышленный софт, который работает десятилетиями.

Унылое зрелище, не находите?

Хотя, конечно, ядро ОС разрабатывать круче.
Кроме ОС еще есть много чего интересного.

crutchmaster
А плюсы тут да, плохие. Потому что не поддерживают на уровне языка работу с utf-8.

Так возьми другой язык, где есть юникод, да вкоряч его в свои плюсы. Наружу будешь выдавать char* никто и не заметит, что там что-то есть.

Через пять лет проект твоей компании упадёт под собственной тяжестью и вам придётся его переписывать.
Он уже прогнулся и почти рухнул 2 раза, а мы переписываем! Да ты чётров пророк!

И ты пойдешь разрабатывать промышленный софт на десятилетия. И не будешь подключать ICU.
Ну и так что ты хочешь от плюсовиков? Вот они походу и подумали, что юникод - это всё хипсторство и он особо не нужен.

А вообще плясать надо от api, а не от программных платформ. Языки дохнут и появляются а предметная область и взаимодействия остаются.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897013
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Давайте представим
Давайте в реальность вернёмся: Отображение буквы "й" . Там ещё по ссылкам полезно почитать. И по ссылкам из ссылок.
Даже если лично вы можете обеспечить для своей программы работу исключительно с NFC, то вам не удастся прогнуть под себя весь остальной мир.
Особенно странно требовать работу "в большинстве случаев" для встроенного типа языка или для стандартной библиотеки языка. И то и другое обязано работать всегда.
Фактически, тип char и его "расширенные" производные надо просто выкинуть - это неудачная абстракция, которая не натягивается на сложившиеся традиции естественных языков. В результате остаётся тип string, который представляет собой байтовый массив в какой-то кодировке.
Оптимальный вариант кодировки - UTF8.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897018
Фотография полудух
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov
Фактически, тип char и его "расширенные" производные надо просто выкинуть - это неудачная абстракция, которая не натягивается на сложившиеся традиции естественных языков. В результате остаётся тип string, который представляет собой байтовый массив в какой-то кодировке.
Оптимальный вариант кодировки - UTF8.

1 байт вмещает 256 цифр (= 256 символов)
в utf8 сильно больше, чем 256 цифр
как вы предлагаете натянуть сову на глобус?
КАК засунуть ВЕСЬ utf8 в 1 char, чтобы всем стало спокойно без полу-символов-пустышек?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897020
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
полудух,

Никак его не надо туда засовывать. char не соответствует символу. Надо класс, который будет предоставлять api для работы с этими char*
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897021
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
полудух
КАК засунуть ВЕСЬ utf8 в 1 char, чтобы всем стало спокойно без полу-символов-пустышек?

Кстати, живы еще свидетели КОИ-8р, не к ночи будет сказано.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897029
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov
Давайте в реальность вернёмся: Отображение буквы "й" . Там ещё по ссылкам полезно почитать. И по ссылкам из ссылок.
Даже если лично вы можете обеспечить для своей программы работу исключительно с NFC, то вам не удастся прогнуть под себя весь остальной мир.

Понятно, букву Й представили в виде двух символов Юникода. На файловой системе и в utf-8 документах с иероглифами - я такого не наблюдаю. Но проблема, конечно, есть. А есть ещё символ ударения... поиск слов работать не будет. А некоторые пользуются буквой Ё. Опять проблемы с поиском и заменой. Понимаете к чему я?

Вы тут начинаете говорить о странных вещах. Вы предлагаете что бы язык программирования поддерживал элементы интеллектуального лингвистического анализа. Мне так кажется.

Basil A. Sidorov
Фактически, тип char и его "расширенные" производные надо просто выкинуть - это неудачная абстракция, которая не натягивается на сложившиеся традиции естественных языков. В результате остаётся тип string, который представляет собой байтовый массив в какой-то кодировке.
Оптимальный вариант кодировки - UTF8.

Да, это было бы идеально. Я об этом тоже писал. Но они этого не сделали, они наплодили кучу сущностей, а утф-8 не поддерживают. Когда я начинаю критиковать проектировщиков С++, мне отвечают что это у меня руки кривые и я ICU не могу подключить.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897030
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
полудух
КАК засунуть ВЕСЬ utf8 в 1 char, чтобы всем стало спокойно без полу-символов-пустышек?

Кстати, живы еще свидетели КОИ-8р, не к ночи будет сказано.

Угу, особенно у военных))
Код: plaintext
1.
2.
3.
4.
QTextStream tStream(fileMy) ;
tStream.setCodec("KOI8-R");
while (! tStream.atEnd())
.....
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897031
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если я подключу ICU, она что такая интеллектуальная что два представления Й будет учитывать как одно и тоже? Т.е. в одной строке utf-8 это будет один символ Юникода, а в другой два. Что выдаст операция сравнения таких строк?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897034
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Скруль использует
Код: plaintext
1.
Content-Type: text/html; charset=windows-1251



А вот несуществующая страничка выкидывает шаблон без кодировки. С кракозябрами.

Это как раз в тему интернационализации и прочего.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897035
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Скруль использует
его забанят за это. Не в ногу с мировыми сайтами.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897036
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Если я подключу ICU
давно бы попробовал.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897037
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Скруль использует
Код: plaintext
1.
Content-Type: text/html; charset=windows-1251


А что такое Скруль? Это не из анекдота "Уберите с руля"? :)
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897038
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
mayton
Скруль использует
Код: plaintext
1.
Content-Type: text/html; charset=windows-1251


А что такое Скруль? Это не из анекдота "Уберите с руля"? :)
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897039
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Если я подключу ICU, она что такая интеллектуальная что два представления Й будет учитывать как одно и тоже? Т.е. в одной строке utf-8 это будет один символ Юникода, а в другой два. Что выдаст операция сравнения таких строк?

По логике. Сначала обе строки должны быть нормализованы. А потом просто сделать хоть посимвольное. Хоть побайтное
сравнение.

Вообще это - не самое сложное. Есть еще другая тема. Сортировки. Их иногда называют Collations.
Там - вообще конь не валялся.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897042
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
petrav
Если я подключу ICU
давно бы попробовал.

Если бы я меньше трепался на форуме, то уже бы попробовал. Я тоже думал об этом. Я могу попробовать с Qt. Если сайт снова проглючит с кодировками, сразу говорю тут два представления буквы Й, выглядят в редакторе почти одинаково. Вроде как Qt использует ICU, но я не уверен.

Код: plaintext
1.
2.
3.
    QString s1 = "й";
    QString s2 = "й";
    bool b1 = s1==s2; // == false!


Да, сайт глючит.. или фильтрует.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897049
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Код: plaintext
1.
QString s1 = "й";

не так проверяй.
В гуи из контрола бери.
А в контрол баба Маша Ctrl +C из 1C и вставляет UTF8
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897052
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. SidorovФактически, тип char и его "расширенные" производные надо просто выкинуть
Оптимальный вариант кодировки - UTF8.

Осталось только вспомнить, что utf-8 это костыль, придуманный как раз с целью "оставить
char*" и мы получаем ту самую std::wstring.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897055
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Вы тут начинаете говорить о странных вещах. Вы предлагаете что бы язык программирования поддерживал элементы интеллектуального лингвистического анализа. Мне так кажется.
Нет.
Я утверждаю, что поскольку реальное положение вещей таково, что тип char произвольной, но фиксированной ширины никак не соответствует понятию "символ" естественных языков, то и не надо даже пытаться работать со строками, как с char[]. Следовательно, прикладное API должно предоставлять тип string, без детализации - какая именно внутри неонка.
Для реализации типа string необходимо выбрать представление и вариантов ровно один: массив байт. Они же - восьмибитные октеты. И это - тоже уже без вариантов.
Остаётся только выбрать кодировку, в которой будут представлены символы в этом массиве байт. И опять-таки, самый разумный вариант - UTF8. Просто потому, что это - единственный вариант, обеспечивающий максимальную совместимость со всем, что основано на API стандартной библиотеки C.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897056
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC SharpА в контрол баба Маша Ctrl +C из 1C и вставляет UTF8

Это под какой ОСью? У Windows в "контрол" вставляется только юникод или текущий ANSI.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
25 сообщений из 409, страница 12 из 17
Форумы / C++ [игнор отключен] [закрыт для гостей] / MSVC и GCC: совместимость кодировок исходников
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]