|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Посмотрел Питонскую библиотеку unicode data. Первые несколько строк я украл со stackoverflow. Далее идет - Лев Николаич. Код: python 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
á á Ⅷ VIII 1) Еh bien, mon prince. Gênes et Lucques ne sont plus que des apanages 2) Еh bien, mon prince. Gênes et Lucques ne sont plus que des apanages 3) Еh bien, mon prince. Gênes et Lucques ne sont plus que des apanages 4) Еh bien, mon prince. Gênes et Lucques ne sont plus que des apanages Забавно. Походе нормализатор действует в обратную сторону. Склеивает комбинации. А мне нужно - наоборот. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 16:38 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petrav И теперь осталось обосновать применение понятий "базовая плоскость" ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 22:18 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petravМы тут не занимаемся алгоритмами Ну раз ты всё для себя выяснил, топик можно закрывать. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
30.11.2019, 22:45 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
[quot petrav#22029124][quot crutchmaster#22029090]пропущено... В современной жизни текст (текстовые данные) сколько занимает процентов в памяти для приложений типа: Ваш мирок гуи-поделок - это не современная жизнь. - Типичное офисное приложение типа 1С. Зависит от того, что гоняют в этом "типичном" приложении. - Типичная страница лонгрид на 20 минут чтения в браузере. С картинками. - Страница ютуб в браузере. У "типичной" страницы может быть 5 мб жаваскрипта с html разметкой, которую надо генерировать, передавать и парсить. Всунул wstring уронил производительность в 2 раза. - Десктопная/мобильная ОС. ОС - не обрабатывает тонны текста. Сколько? Во-первых процент очень мал, во-вторых абсолютные размеры - копейки. В html/js/css процент юникола действительно очень мал. Там подавляющая часть - ascii. Зачем ради этого всё гнать в utf16/32 решительно непонятно. Ну сэкономишь ты десяток мегабайт при работе за компом. На моём стареньком компе 8Гб памяти, а текста сейчас загружено ну мегабайт 20-ть при открытых 10-ти приложениях из которых два браузера. Вы всё измеряете десктопом. Кроме этого в мире полно всего. Так жгут нули в тексте? А глюки из-за неправильного понимания работы Юникода не жгут? Да суйте wstring в свои гуи на здоровье. Я говорю как есть. Гуи - не центр мира, на си/плюсах пишут фундаментальные вещи, которые составляют основу ИТ инфрастуктуры. Ну, да, они немного положили на гуистов, которые херачат названия utf8 прямо в код. Там люди просто не понимают, зачем так надо делать. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 13:26 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Я-бы встал и поаплодировал. rust/go. Вставай, аплодируй. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 13:58 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
crutchmasterУ "типичной" страницы может быть 5 мб жаваскрипта с html разметкой, которую надо генерировать, передавать и парсить. Всунул wstring уронил производительность в 2 раза. Чисто из любопытства: в какое место яваскрипту можно всунуть std::wstirng? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 14:07 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
crutchmaster Гуи - не центр мира, на си/плюсах пишут фундаментальные вещи, которые составляют основу ИТ инфрастуктуры. в этих "фундаментальных вещах" только ascii и есть обычно ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 14:31 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
crutchmaster mayton Я-бы встал и поаплодировал. rust/go. Вставай, аплодируй. а чему там аплодировать, они медленнее C++ всё на свете медленнее C++ ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 14:33 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух При разработке rust и go ставились вполне себе конкретные задачи. Go должен был заменить python как медленный язык для google - поисковых сервисов. Заменил. Работает. Насчет rust - я не знаю. Но убежден что мотивация была. По поводу медленнее-быстрее. Вы, как владелец бизнеса не ставите задачу - быть быстрее языка X на 20%. Вы хотите чтобы ваш бизнес работал и ваше ПО было удобно в дописывании и доработке. По сути это диверсификация рисков. Вы СОГЛАСНЫ платить за потерю перформанса в 20%. Пофиг. Ведь вы покупаете узлы облака и производительность наращивается. Но вы не согласны ждать долго разработку. Вы хотите чтоб микросервис был поднят уже завтра. Ведь завтра - стартует маркетинг акция и вам нужен живой и работающий endpoint. C++ в этой плоскости проигрывает языку Go. Т.к. цена разработки подобного микросервиса на С++ будет не на 20% дороже а дороже в несколько раз. И время разработки будет дольше. Экспертиза С++ дорого стоит. Маркетинг акция - может не взлететь к сроку. Я описал видение со стороны своего сегмента. Быть может у вас есть другая точка зрения. Я с ней тоже согласен. Но я просто оперирую вот такими вот терминами. Выгодно-невыгодно. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 15:51 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Хм. Интересно. Выдержка из Python Код: python 1. 2. 3. 4. 5. 6.
Греческую букву Дельта-заглавная можно набрать 3 способами. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 15:57 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov, Всё это барахло передаётся телепатически, или всё таки где-то хранится/обрабатывается? ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 18:02 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух, Так там ничего больше и не нужно же. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 18:03 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
petrav char32 - это максимум четыре миллиарда символов. 8-16-32 бита кодируют не символы, а коды. Символы состоят из одного или нескольких кодов и этот факт не зависит от кодировки. Это больше чем utf-8 по текущему стандарту (при максимуме четыре байта)."Огорчу я тебя до невозможности". Юникод ограничен семнадцатью плоскостями по 65536 кодов в каждой. Это даёт 21 бит на код и от кодировки не зависит - хоть в uint128 упаковывайте. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 18:21 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
crutchmasterВсё это барахло передаётся телепатически, или всё таки где-то хранится/обрабатывается? Это Вы о какой части "5 мб жаваскрипта с html разметкой" сейчас говорите? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
01.12.2019, 20:14 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton Я описал видение со стороны своего сегмента. Быть может у вас есть другая точка зрения. Я с ней тоже согласен. Но я просто оперирую вот такими вот терминами. Выгодно-невыгодно. ну это только одна сторона медали а вообще бизнес это не только про "купи-продай побыстрей" да и жизнь это не только про бизнес... Вообще-то Информация нас двигает вперёд. кому-то ещё геномы считать, кому-то погоду, а кому-то даже, прости-хосподи, ИИ подавай... и хотят они именно побыстрей и покачественней считать. Конечно в мире должен быть удобный инструмент для быстрой разработки (Go) Но первое место всё равно за C++. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 00:11 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух да и жизнь это не только про бизнес... Вообще-то Информация нас двигает вперёд. кому-то ещё геномы считать, кому-то погоду, а кому-то даже, прости-хосподи, ИИ подавай... и хотят они именно побыстрей и покачественней считать. Это очень хорошо что вы напомнили всем нам о качестве. Данный топик как раз начался с вопросов качества. А именно - кодировки. И далее мы обсуждали реализацию строкового типа в С++. Видимо не всё так хорошо в Королевстве Датском. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 01:22 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
всё познаётся в сравнении. абсолютно ВСЕ остальные "королевства" написаны на C ну и где там "хорошо"? что они могут предложить, кроме очередной абстракции над C? максимум напишут очередной вариант string, а он что, будет меньше занимать? или быстрее работать? если бы было что-то действительно стоящее, оно бы уже было в C. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 02:55 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
И, в конце-концов, о чём вы вообще спорите? как у программистов у вас вообще таких претензий быть не может, потому что кто-то, а вы то обязаны знать, ЧТО происходит в самом низу, КАК работает процессор, из каких кирпичиков создаётся компьютер. У нас есть БАЙТ. И в этот БАЙТ можно запихнуть 256. ВСЁ. Большего в него не запихнёшь НИКАК. ЧТО тут можно ещё придумать? БАЙТ на 65536, на 16 бит? Ну вот подъедут фотонные/квантовые компы, может что-то и изменится, а пока всё это пустой трёп. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 03:01 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov, О любой. Html с юникодом, который генерирует пхп. ЖС/Цсс с эмодзи, который ест браузер. Толстенные вебпаки с половиной npm. Json/xml, который летает туда-сюда. Html генерируется медленными язычками из шаблонов, которые тоже, надо прочитать, сделать там замены. wstring и хранение в utf16/32 просто в двое увеличило бы эту работу. По поводу плюсов и юникода в сорцах я написал в начале треда. Ascii в сорцах и gettext - выбор человека. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 04:45 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Dimitry SibiryakovЧисто из любопытства: в какое место яваскрипту можно всунуть std::wstirng? С какой стороны? ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 04:48 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух вы то обязаны знать, ЧТО происходит в самом низу, Программисты как и врачи сейчас делятся на прикладников и системщиков. Прикладникам не только нужно знать байты. Им нужна строка символов). полудух ЧТО тут можно ещё придумать? API нверно для работы со строками. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 08:31 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
полудух, Забавно. По твоей логике мы сегодня должны писать даже не на сях а на ассемблере ведь на нем были созданы все "королевства". ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 11:12 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
Basil A. Sidorov petrav char32 - это максимум четыре миллиарда символов. 8-16-32 бита кодируют не символы, а коды. Символы состоят из одного или нескольких кодов и этот факт не зависит от кодировки. Это очевидно. Ладно. Давайте предметно обсудим. Давайте представим, что мы пишем программу (небольшую, но не тривиальную)... например, автоматизирующую работу (диагностику) с неким промышленным оборудованием. Под требования заказчика. Не важно что это, возьмём газовые турбины отечественного производства. Допустим нужно локализовать этот софт для экспорта в Казахстан. Хорошо, наверное, Вам Казахстан не близок. Пусть будет фантастическая ситуация... Мы поставляем их в Германию. Бинго! Приведите пример, когда бы нам не хватило wstring и представления, что мы работаем с символами как с массивом. PS: Если честно, никогда не работал с софтом управляющим газовыми турбинами, но пример гипотетический, подставьте любое промышленное оборудование. От достаточно простого, до сложного. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 11:19 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
mayton полудух, Забавно. По твоей логике мы сегодня должны писать даже не на сях а на ассемблере ведь на нем были созданы все "королевства". нет там такой логики, не выдумывай, я вообще о другом писал. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 11:21 |
|
MSVC и GCC: совместимость кодировок исходников
|
|||
---|---|---|---|
#18+
crutchmaster Ваш мирок гуи-поделок - это не современная жизнь. Удивляют меня такие заявления от человека для которого нужно написать целую страницу комментов, что бы он понял как работает std::mblen(). Ты смотрел на сигнатуру функции и сделал такое предположение, что само существование этой функции становилось абсурдом. 1. GUI это не современная жизнь? 2. Я довольно мало занимаюсь непосредственно GUI. 3. Мы обсуждаем именно офисный софт не завязанный на сложную лингвистику. PS: А ты в какой области разработки ПО работаешь? Плиз: языки программирования и предметная область. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2019, 11:31 |
|
|
start [/forum/topic.php?fid=57&msg=39896791&tid=2017506]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
43ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
60ms |
get tp. blocked users: |
2ms |
others: | 15ms |
total: | 167ms |
0 / 0 |