powered by simpleCommunicator - 2.0.58     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / MSVC и GCC: совместимость кодировок исходников
25 сообщений из 409, страница 13 из 17
MSVC и GCC: совместимость кодировок исходников
    #39897058
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Попробуй кириллическое Й краткое заменить на

Код: plaintext
1.
"й"
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897059
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
petrav
Код: plaintext
1.
QString s1 = "й";

не так проверяй.
В гуи из контрола бери.
А в контрол баба Маша Ctrl +C из 1C и вставляет UTF8

Я как раз и сделал копипасту с Хабра по ссылке которую косвенно посоветовали чуть выше: ссылка . Там в первых абзацах такая буква Й. С клавиатуры она не вводится, но выглядит как обычная Й. Мне ещё только не хватало это вставлять в контрол, потом брать с контрола. Может мне ещё update/select сделать в MS SQL и в Оракл заодно?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897061
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Скруль порвал кодировку внутри исходников. У меня тоже самое 22029484
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897064
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Попробуй кириллическое Й краткое заменить на

Код: plaintext
1.
"й"


Тоже самое:

Код: plaintext
1.
2.
3.
    QString s1 = "й";
    QString s2 = "й";
    bool b1 = s1==s2; // == false!


Notepad++ тоже думает что это разные символы.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897065
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Напутал. Код и = 0438
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897071
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Напутал. Код и = 0438

У меня эти строки не совпадают. Надеюсь у тебя код маленькой й. Да Qt просто видит что длина строк разная - и на этом операция сравнения заканчивается.

Код: plaintext
1.
2.
3.
4.
    QString s1 = "й";
    QString s2 = "й";
    bool b1 = s1.normalized(QString::NormalizationForm_D)==
              s2.normalized(QString::NormalizationForm_D); // == true!


:) Ну вот.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897077
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Мне ещё только не хватало это вставлять в контрол, потом брать с контрола
главное не оторваться от реальности.
А то ведь есть те что в коде вместо clRed пишут красное в шестнадцатеричном)
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897085
Фотография полудух
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
полудух
КАК засунуть ВЕСЬ utf8 в 1 char, чтобы всем стало спокойно без полу-символов-пустышек?

Кстати, живы еще свидетели КОИ-8р, не к ночи будет сказано.

у меня он был на FreeBSD ещё в 2009
нет, спасибо
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897086
Фотография полудух
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
полудух,

Никак его не надо туда засовывать. char не соответствует символу. Надо класс, который будет предоставлять api для работы с этими char*

какой ещё API? в string есть API, пользуйтесь - .substr(), .rfind(), .etc
как вы собрались 100500 символов юникода хранить без двух байт?
проверять каждый символ, что он из таблицы ДО 256?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897088
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нормализация.

В Питоне примерно так (UTF-16). Код буквы И + этот чортов символ птичка https://unicode.org/cldr/utility/character.jsp?a=0306
Код: python
1.
>>> print(unicodedata.normalize('NFC',u'й'))


й
>>>

В чем разница этих 4х алгоритмов нормализации (NFC, e.tc.) я ХЗ. Но в QT тоже должна быть какая-то опция
которая регулирует этот алгоритм.

Поищи Plz.

Чуть позже посмотрю для utf-8
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897090
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petravs1.normalized(QString::NormalizationForm_D)

mayton в QT тоже должна быть какая-то опция
которая регулирует этот алгоритм.
Ты не поверишь...
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897092
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я прошу прощения за то что искусственно втаскиваю в топик тему Питона .
Я его не лоббирую! Более того я даже его не знаю! Но мне кажется что
при разборе bestpractices с кодовыми страницами и кодировками - имеет смысл смотреть
по сторонам как где сделано. Это обычно наталкивает на мысли.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897097
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот в Питоне байтовый массив (фраза на Испанском) рассматривается как utf-8 строка.

Код: python
1.
>>> print(b'El ni\xc3\xb1o come camar\xc3\xb3n'.decode('utf-8'))


El niño come camarón
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897100
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Скруль порвал кодировку внутри исходников. У меня тоже самое 22029484

Я кажется догадался. Скруль - это sql.ru. То-то мне это мне сразу напомнило как некоторые называют SQL - сикуль или как-то так.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897107
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Но в QT тоже должна быть какая-то опция
которая регулирует этот алгоритм.
а он собрался от Qt далеко отходить в сишные дллки))
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897108
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Вот в Питоне байтовый массив (фраза на Испанском) рассматривается как utf-8 строка.

Код: python
1.
>>> print(b'El ni\xc3\xb1o come camar\xc3\xb3n'.decode('utf-8'))


El niño come camarón


Кто мне подскажет как эти чортовы символы ñ сверху называются ó.

Возможно две птички - это умляут (umlaut) но я не уверен. Или акцент (accents).
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897111
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
mayton
Скруль порвал кодировку внутри исходников. У меня тоже самое 22029484

Я кажется догадался. Скруль - это sql.ru. То-то мне это мне сразу напомнило как некоторые называют SQL - сикуль или как-то так.

Просто ты, барин, здесь редко бываешь.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897115
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
mayton
Но в QT тоже должна быть какая-то опция
которая регулирует этот алгоритм.
а он собрался от Qt далеко отходить в сишные дллки))

Да не собираюсь я далеко отходить. Я говорил: на Qt только GUI, логика на С++ с минимумом сторонних библиотек. Это позволит легко отказаться от Qt если он умрёт или перестанет устраивать.

Не нужно мне учитывать умляуты и прочие, если даже на Qt и на Питоне просто так не работает операция сравнения строк. Вы понимаете что этот вызов normalize() - это два обращения к подсистеме динамической памяти и эти обращения блокируют все потоки, которые в это время тоже вызывают new/delete и тому подобное.

Вам не нужна оптимизация, а мне в ядре приложения (не в GUI) нужна.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897124
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Еще один вариант испанского мальчика жрущего креветок.

Код: python
1.
>>> 'El nío come camarön'



Хотя я нормализацию не заказывал. На печати в консоли выглядит так.

'El nío come camarön'

Код: python
1.
2.
>>> len('El nío come camarön')
21


И длина - 21 символ с точки зрения строкового API

После нормализации.

Код: python
1.
>>> unicodedata.normalize('NFC',u'El nío come camarön')


'El nío come camarön'
Код: python
1.
>>> len(unicodedata.normalize('NFC',u'El nío come camarön'))


19

Не знаю как будет видно сырую строку после публикации. Но моя bash консоль вполне себе
нормально отображает эти 2 символа с диакритикой с явной нормализацией и без. И среда разработки тоже если скопировать.

Но чисто визуально я вижу различия после normalize. Символ слегка изменен. Хотя суть наверное та-же.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897126
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
говорил: на Qt только GUI, логика на С++ с минимумом сторонних библиотек.
пишем недостижимый идеал прямо по булгакову.
Получим шарикова.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897127
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сетевую либу, протокол общения между модулями тоже свой писать будем? Как со строками?
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897132
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
Сетевую либу, протокол общения между модулями тоже свой писать будем? Как со строками?

Я не пишу библиотек работы со строками. API работы с сокетами - POSIX или близко к этому.
Модератор: Edited
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897148
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav,
Мои мысли ясные и логичные).
Ваш метод (а не вы сами) по производству универсальной программы работь не будет.
Врубились что вы сами - крутой и успешный прогер. А вот метод избрали не рабочий.
А то обиделись, как девочка прям.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897150
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
PetroNotC Sharp
petrav,
Мои мысли ясные и логичные).

Допустим. Вот твоя цитата:
PetroNotC Sharp
Сетевую либу, протокол общения между модулями тоже свой писать будем? Как со строками?

Из неё явно следует, что я пишу свою библиотеку работы со строками.

И теперь я прошу привести мою цитату из которой следует, что я пишу свою либу работы со строками.
...
Рейтинг: 0 / 0
MSVC и GCC: совместимость кодировок исходников
    #39897151
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Девочки - не ссорьтесь. Топик - нормальный. Жалко будет его закрыть.
...
Рейтинг: 0 / 0
25 сообщений из 409, страница 13 из 17
Форумы / C++ [игнор отключен] [закрыт для гостей] / MSVC и GCC: совместимость кодировок исходников
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]