Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Нужно строку в кодировке Utf8 вывести в консоль по 10 символов, в строке могут быть как буквы кириллицы, так и латиницы и знаки препинания. А UTF-8 — многобайтовая кодировка, символ в ней может быть представлен как одним байтом, так и четырьмя. Сделал функцию преобразования из Utf8 в cp1251, все работает. Но возможно кто-то подскажет другой выход без преобразования в cp1251. Как работать с такими строками при помощи str.size() или str.substr(n ,m). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.08.2017, 17:52 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
polin11, OS - windows? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.08.2017, 17:59 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
OS Win, IDE MS VS ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.08.2017, 18:04 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
polin11Нужно строку в кодировке Utf8 вывести в консоль Код: plaintext ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.08.2017, 19:07 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
polin11Нужно строку в кодировке Utf8 вывести в консоль по 10 символов, в строке могут быть как буквы кириллицы, так и латиницы и знаки препинания. А UTF-8 — многобайтовая кодировка, символ в ней может быть представлен как одним байтом, так и четырьмя. Сделал функцию преобразования из Utf8 в cp1251, все работает. Да не может всё работать. Русский и английский тексты будут видны, остальные -- пойдут вопросиками... polin11Но возможно кто-то подскажет другой выход без преобразования в cp1251. Как работать с такими строками при помощи str.size() или str.substr(n ,m). UTF-16, wchar_t, wstring, Преобразуется той же функцией, что и в cp1251. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 13:52 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Basil A. Sidorovpolin11Нужно строку в кодировке Utf8 вывести в консоль Код: plaintext Это понятно, но это не позволит ему разбить строку по 10 символов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 13:53 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
MasterZivэто не позволит ему разбить строку по 10 символов... Да, для этого придётся прочитать как устроена UTF-8 и чем первичные байты отличаются от остальных. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 14:03 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Dimitry SibiryakovMasterZivэто не позволит ему разбить строку по 10 символов... Да, для этого придётся прочитать как устроена UTF-8 и чем первичные байты отличаются от остальных. Не обязательно, можно перевестись в URF-16/32, и радоваться. ПРАВДА, это принципиально изменить ситуацию только тем, что будет работать на большем диапазоне возможных символов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 15:11 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
MasterZivDimitry Sibiryakovпропущено... Да, для этого придётся прочитать как устроена UTF-8 и чем первичные байты отличаются от остальных. Не обязательно, можно перевестись в URF-16/32, и радоваться. ПРАВДА, это принципиально изменить ситуацию только тем, что будет работать на большем диапазоне возможных символов... чему радоваться? UTF-16 тоже имеет символы, закодированные числом байт, большим чем два. https://en.wikipedia.org/wiki/Comparison_of_Unicode_encodings до 12 байтиков на букву. а вот UTF-32 да, декларируется как direct indexed, т.е. палюбасу всегда 4 байта на символ, если бы не одно но.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 17:50 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
dbpatchдо 12 байтиков на букву. неа. суррогатная пара по частям не переводится в utf-8 а 6-ти байтная utf-8-подобная последовательность - за пределами стандарта ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.08.2017, 19:44 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Любой топик с кодировками у нас неизбежно перетекает в обсуждение суррогатных пар. Я уже могу делать ставки на на новые топики. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.08.2017, 18:40 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
mayton, а что их обсуждать - стандарт просто почитать и всё ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.08.2017, 18:55 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Изопропилdbpatchдо 12 байтиков на букву. неа. суррогатная пара по частям не переводится в utf-8 а 6-ти байтная utf-8-подобная последовательность - за пределами стандарта за какими еще пределами? там по ссылке выше была просто 7-ми битная машина, и там - до 12 байтиков. и при чем тут суррогатные пары к UTF-32? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.08.2017, 11:47 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
dbpatch, откуда 12 байтов на "букву" ? (codepoint наверное) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.08.2017, 12:02 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
Изопропилdbpatch, откуда 12 байтов на "букву" ? (codepoint наверное) там вверху ссылка. открываем, жмем Ctrl+F, вбиваем 12 ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.08.2017, 12:41 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
dbpatchИзопропилdbpatch, откуда 12 байтов на "букву" ? (codepoint наверное) там вверху ссылка. открываем, жмем Ctrl+F, вбиваем 12 ... и видим UTF-8 quoted-printable ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.08.2017, 17:06 |
|
||
|
работа со строками Utf8
|
|||
|---|---|---|---|
|
#18+
maytonЛюбой топик с кодировками у нас неизбежно перетекает в обсуждение суррогатных пар.Да сколько уже можно путать суррогатные пары и составные символы?! Суррогатные пары необходимы, чтобы представлять кодовые точки (и любые символы) за пределами базовой плоскости (BMP) в UTF16. А составные символы не зависят от кодировки и массово представлены в BMP. И не только иероглифами . ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.08.2017, 17:51 |
|
||
|
|

start [/forum/topic.php?fid=57&msg=39507889&tid=2018098]: |
0ms |
get settings: |
9ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
160ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
| others: | 292ms |
| total: | 549ms |

| 0 / 0 |
