|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petrav Т.е. поддержка utf-8 изначально была в языке Си Это UTF-8 был сделан так, чтобы обеспечить полную совместимость с US-ASCII. А работоспособность стандартной библиотеки гарантирована только на этом подмножестве. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:20 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov mayton Если-бы толстая корпорация типа yandex взяла управление в свои руки и сказала - ша бротва! Мы делаем свой С++ А если даже не и сожрали, то глухое игнорирование - ничем не лучше. Хм... При чем здесь антимонопольность? Игнорирование - плевать. Если вещь ценная и интересная (как Linux в 90х) то ей будет дана жизнь. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:21 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Возможно. Если хранить вместе со строкой признак кодировки. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:22 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Игнорирование - плевать. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:23 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov mayton Возможно. Если хранить вместе со строкой признак кодировки. Вы по use case не сможете этого сделать. Мы же говорим о java String? Или вы о чем то другом? ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:28 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Или вы о чем то другом? Более того, единственная причина, по которой Java 9+ не использует UTF8 - индексация String по кодовым точкам. Сейчас это константная операция, а будет - линейная. Шипилёв, в одном из своих выступлений, отмечал, что такое изменение контракта Java SE API было сочтено недопустимым. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:43 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
(пожимая плечами) Я легко признаю ошибку если я оговорился. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:46 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Да в этих комитетах - царит какое-то разложение. Есть у них хоть один proposal который ужесточает стандарт? И делает его более... недёжным что-ли. Предсказуемым на разрядности int к примеру. Вот честное слово я уже не верю в комитеты. Если-бы толстая корпорация типа yandex взяла управление в свои руки и сказала - ша бротва! Мы делаем свой С++. И там будет мать ево Unicode-строка как фундаментальный образующий тип языка. А все синонимы мы просто выкосим нахер. И опубликуем как форк С++ стандарта по версии yandex. Я-бы встал и поаплодировал. И жизненных примеров много. Когда источником нового языка была именно корпорация а не всякие бл...ские комитеты. В общем, я согласен с Вами. В очередной раз с Вами соглашусь. Но я думал о том же в контексте, что у этих комитетов просто денег нет на серьёзное проектирование. Что не могут они конкурировать в проектировании языка программирования, по сравнению с языками в которые корпорации вкладывают огромные деньги (Java, C#). И, конечно, я не думал о Яндексе. :) Вот Гугл был бы лучшим выбором. PS: И да, конечно, нормальная Юникод-строка в стиле Си и встиле С++ должна быть в языке С++. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 20:46 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Гугл уже порешал для себя проблемы. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 21:12 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Вот ей-богу - странные вы люди ... Казалось - в чём проблема?.. Взяли стандарт языка (черновик стандарта), выкинули из него всякий хлам и добавили разумного, доброго, вечного. Даже компилятор не надо делать с нуля - берём LLVM и чуток допиливаем "до идеала" один из фронтэндов. Только что вы собрались делать в другой камере, если у вас перестанет собираться 90-99 процентов используемого кода? Тоже чуток допилите? P.S. Windows 7 SDK Код: plaintext 1. 2. 3.
... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 21:16 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov char в Java - примитивный тип. Character - класс-обёртка, которая ничем не лучше и не хуже других классов-обёрток. а я и не говорю про лучше/хуже, я говорю про, что в яве класс довели до абсурда. crutchmaster Чуть больше половины байт - нули. ну так выравнивание жи. Либо шашечки, либо ехать. Либо быстро работаем со строкой, либо чекаем каждый символ и спасаем 1 байт, но выводим с задержкой в 3-5 раз. И ради чего? ВСЯ деятельность Шекспира занимает в итоге 5 мегабайт! Где же взять столько памяти... Это особенности unicode, причём тут C++, это в юникоде чары по 2-4 байта. Как вы себе представляете строку с перемешанными 1-2 байтами? petrav А глюки из-за неправильного понимания работы Юникода не жгут? Какие глюки у вас с wstring, покажете пример уже, второй раз спрашиваю? petrav Да в самом С++ больше десятка представлений строк. да хоть 100500, они там для совместимости остались вы юзаете string/wstring и всё. Точка. Или, если хотите, можно жёстко указать размер : u8/u16/u32 petrav Да те кто занимаются проектированием С++ просто занимаются не тем чем нужно. это вы занимаетесь не тем, чем нужно - ищете чёрную кошку в тёмной комнате, где её нет. А развитие C++ идёт лучше, чем во всех других языках. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 21:47 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух Почитайте этот-же форум С++. Здесь каждый десятый или двадцатый топик - это кодировки и строки. Вы тоже им всем дадите этот совет? ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 22:02 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton полудух Почитайте этот-же форум С++. Здесь каждый десятый или двадцатый топик - это кодировки и строки. Вы тоже им всем дадите этот совет? да на что жалуются то? покажите мне уже, чего я не могу сделать, положив текст в wstring? при том, что конверсия есть куда угодно: Код: plaintext 1. 2. 3.
... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 22:25 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Я когда-то FAQ собирался поднимать по вопросам кодировок и строк на C++. Искать сейчас мне лень. Но в форуме много подобных вопросов. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 23:12 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух да на что жалуются то? Жалуются что половина текста нулей, спать не могут! полудух покажите мне уже, чего я не могу сделать, положив текст в wstring? Что бы Вам показать что нельзя сделать очевидным способом на wstring нужно или иероглифы знать, или найти в инете хоть одну суррогатную пару. Понятно всем лень. Или ума не хватает. Смысл в чём: wchar_t действительно не очень с точки зрения идеального миропредставления. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 23:25 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Нашел нормализатор под Питон. Щас попробуем. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 23:42 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petrav Смысл в чём: wchar_t действительно не очень с точки зрения идеального миропредставления. а что "очень"? КЛАСС целый налепить вместо типа и тормознуть абстракцией от души, как в яве? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 00:45 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух petrav Смысл в чём: wchar_t действительно не очень с точки зрения идеального миропредставления. а что "очень"? КЛАСС целый налепить вместо типа и тормознуть абстракцией от души, как в яве? 1. Вам уже ответили, что char в Яве - это не класс. Как и в Шарпе. 2. wchar_t не вмещает всю таблицу Юникода. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 00:55 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
В java для всех примитивных типов созданы иммутабельные объекты-обертки. Между ними работает implicite преобразование. Авто-боксинг. Это нужно для поддержки примитивов в коллекциях и для генериков. Есть примитив char и есть пкласс Character. Есть примитив int и есть обертка Integer. JIT компиллятор во многих случаях умеет превращать обертки в примитивы есть есть возможность и если это не меняет логику. Примитивы не имеют общего супертипа в Java. Однако в Scala это исправлено. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 01:42 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petrav 2. wchar_t не вмещает всю таблицу Юникода. ну так char32_t есть (u32string) ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 02:29 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Есть примитив char и есть пкласс Character. ок, ок один хер они апофеоз абсурда из классов сделали ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 02:30 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Язык - способ выражения мысли. Помнишь афоризм о том что программы пишутся для прочтения человеком и т.д.? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 10:51 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух ну так char32_t есть (u32string) ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 11:33 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov полудух ну так char32_t есть (u32string) char32 - это максимум четыре миллиарда символов. Это больше чем utf-8 по текущему стандарту (при максимуме четыре байта). Не надо рассказывать про немецкие умляуты, иероглифы в знакомом вам китайском селе, символы ударения и прочие сугубо лингвистические нюансы. Мы тут не занимаемся алгоритмами апперкейса той немецкой буквы похожей на Бетту, которая переходит в SS в случае редких интонаций, перед тем как тебе прилетает в нос. Это не лингвистический форум. Мы не обсуждаем тут авторский стиль Пушкина. Хотя мы его уважаем. Мы не обсуждаем алгоритмы автоматического перевода или написания стихов на нейронных сетях. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 12:08 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov полудух ну так char32_t есть (u32string) И теперь осталось обосновать применение понятий "базовая плоскость" и "половина (первая) базовой плоскости" в рамках обсуждаемой проблемы. Со ссылками. Иначе это будет выглядеть как... ну человек привык бросаться красивыми терминами не понимая их сути. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 12:15 |
|
|
start [/forum/topic.php?fid=57&msg=39896617&tid=2017506]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
35ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
52ms |
get tp. blocked users: |
1ms |
others: | 299ms |
total: | 429ms |
0 / 0 |