powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / C++ [игнор отключен] [закрыт для гостей] / Заменить запись в файл с txt на xlsx
25 сообщений из 150, страница 2 из 6
Заменить запись в файл с txt на xlsx
    #40046916
ъъъъъ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
bk0010
Технология Rushmore. То ли сжатые индексы, то ли bitmap (не помню). Подробности тут , искать слово Rushmore.

В том-то и дело, что подробностей нигде нет. Ни описания реализации, ни методики применения, одни общие слова.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046919
Фотография Alex_Ustinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
на фоксклубе же есть для понимания
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046925
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сложение битмапов полученных с двух/нескольких индексов для последующей выборки записей.
Это использовали все кому не лень, включая Interbase.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046928
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По смыслу похоже на Bitmap Index. Однако фраза "это использовали все кому не лень" - слишком сильная фраза.
Мне не нравится квантор "все". Это слишком идеализирует наш мир. Скорее использовали те кто хотел.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046932
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Откуда в FoxPro битмап индексы?
(по крайне мере 2.5, 2.6, дальше уже Visual FoxPro)
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046934
Фотография Alex_Ustinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
о VFP речь и идет
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046935
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Рашмор - не в индексах, а в способе использования сразу нескольких.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046968
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Табы на просмотре текста выглядят ужасно.

В сыром виде, что угодно выглядит ужасно.
mayton
Сложно понять - где пробел в данных а где разделитель.

Просто надо использовать специальный софт, который делает табличку и умеет смотреть файл кусками.
mayton
Никогда не понимал этот формат.

Это замечательный формат. Он преобразовывается в массив массивом буквально на раз-два. Делаешь сплит по \n, потом пробегаешься по тому, что вышло и делаешь сплит по \t. Всё. С csv - чехарда экранированием кавычек и "," / ";", которых в тексте, как правило, навалом, в отличии от табов.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046969
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Если сплиттер == запятая, все нормально экранируется кавычками. И сами кавычки тоже.

Никак она не экранируется. Парсеру надо бегать по строке и помнить, была там кавычка или нет. Еще кавычку в кавычках надо экранировать и вырезать по кавычке в начале/конце строки, когда перегоняешь из csv. В tsv экранируются только непечатные символы при записи, которые и так должны быть экранированы по всем правилам здравого смысла.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046972
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
В tsv экранируются только непечатные символы при записи, которые и так должны быть экранированы по всем правилам здравого смысла.
... но не обязаны: возникает необходимость "переделывать" \t, \r, \n и прочие "радости" в полях записи.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046977
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Фокс - хорошая штука. Уважаю. У них интересный тип индекса был. Какой-то там rush.
И на сравнительных тестах если сравнивать dBase vs Fox, то последний выигрывал когда
были запросы специфичны к этому рашу. Интересно Microsoft перенёс это ноу-хау в MS-SQL?

Кто есть MS-SQL-щики? Проясните plz.

Рашмор по сути это построение плана выполнения запроса. Официальных заявлений не было, а по сплетням что-то из фокса позаимствовали для MSSQL
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40046979
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov
но не обязаны

Обязаны.
Если у тебя будут \r\n в строках их в любом случае придётся переделывать. Исключительно табы отэкранировать проще, когда заворачиваешь их в строку.

Basil A. Sidorov
прочие "радости" в полях записи.

Какие "радости"? Непечатные? Их в любом случае надо экранировать. С печатными никаких проблем нет в принципе. Кроме \n\t следить не зачем. С запятыми еще натрахаешься, когда тебе с ru локали будут вещественные числа переводить в строку с запятой вместо точки и при парсинге ждать запятую.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047012
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
Если у тебя будут \r\n в строках их в любом случае придётся переделывать.
Подчеркнул.
Урежьте, в общем, квантор всеобщности.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047016
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov
Урежьте, в общем, квантор всеобщности.

А как твой csv читать, если там в значениях /n ?? Из-за такого вот говнолепства потом ломаешь голову.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047056
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
mayton
Если сплиттер == запятая, все нормально экранируется кавычками. И сами кавычки тоже.

Никак она не экранируется. Парсеру надо бегать по строке и помнить, была там кавычка или нет. Еще кавычку в кавычках надо экранировать и вырезать по кавычке в начале/конце строки, когда перегоняешь из csv. В tsv экранируются только непечатные символы при записи, которые и так должны быть экранированы по всем правилам здравого смысла.

Ты отстал от жизни.

https://tools.ietf.org/html/rfc4180
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
   6.  Fields containing line breaks (CRLF), double quotes, and commas
       should be enclosed in double-quotes.  For example:

       "aaa","b CRLF
       bb","ccc" CRLF
       zzz,yyy,xxx

   7.  If double-quotes are used to enclose fields, then a double-quote
       appearing inside a field must be escaped by preceding it with
       another double quote.  For example:

       "aaa","b""bb","ccc"




И переводы строки и кавычки внутри полей разрешены.

Сложность парсера не имеет значения. Это его, парсера responsibility.

Я речь вел просто о трабл-шутинге ошибок загрузки. И с моей скромной точки зрения чем больше принтабельных
символов - тем лучше. TSV - тоже неплохо, но надо смотреть сквозь редактор с хайлайтом контролов.

Я вижу единственный полезный смысл - поиграть с выбором символа квоты и сплиттера чтобы было меньше
пересечений с доменной областью и CSV/TSV был human-readable особенно в тех случаях когда нам это
ничего не стоит с точки зрения конфигурации.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047078
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
А как твой csv читать, если там в значениях /n ??
Я за csv не агитировал.
Я утверждал (и утверждаю), что tsv не является "серебрянной пулей".
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047415
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Сложность парсера не имеет значения. Это его, парсера responsibility.

Ровно до тех пор, пока функционал парсера тебя устраивает и пока этот парсер доступен.
mayton
TSV - тоже неплохо, но надо смотреть сквозь редактор с хайлайтом контролов.

CSV с переносом строк не надо смотреть сквозь редактор? Там вообще всё будет поломано. Ну и просмотр - это responsibility смотрелки.

mayton
И переводы строки и кавычки внутри полей разрешены.

Что там у местного парсера таблички с многосточными значениями? Всё ожидаемо плохо? Почему не прикрутили нормальный парсер? Правильно, нахера делать нормальные человеческие эскейпы для спецсимволов, давайте херачить всё в двоичном виде и обламываться.

Код: sql
1.
2.
3.
4.
5.
[csv]
1,2
"1
2","3
4"[/csv]

12"12""34"

mayton
Я вижу единственный полезный смысл - поиграть с выбором символа квоты и сплиттера

Не из чего выбирать. \t, \n и escape \\ \t \n объективно лучше. Хочешь - меняй таб на ";" и смотри. Если твой редактор так не может - это его responsibility.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047417
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov
Я утверждал (и утверждаю), что tsv не является "серебрянной пулей".

tsv - это лучший вариант. У вас не может быть против этого аргументов. Вы можете сказать, что парсеру надо делать замену для escape, но csv тоже надо менять две кавычки на одну. В остальном парсер tsv - элементарен, формат проще и надёжнее, чем csv. Легко просто и без сраных танцев делается, например, подсчёт строк или столбцов в строке.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047420
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Для записи TSV/CSV файлов редко используют специализированные оболочки, просто пишут как текстовый файл. В результате получается рабочий код, который стабильно работает пока оператор не заведет что-то нестандартное, например наименование товара начнет с двойной кавычки и начинается веселье: полдокумента почему-то не грузится, т.к. в CSV можно обрамлять перенос строк.
В TSV тоже может быть подобное, хоть табуляция непечатный символ, но он копипастится, и этим способом попадает в БД, но тут проблемы только в одной строке, следующие грузятся, и источник проблемы проще искать.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047428
Фотография crutchmaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima T
Для записи TSV/CSV файлов редко используют специализированные оболочки

Нее, руками писать в файл - это уже за гранью. Там напишут запятых в десятичный разделитель вместо точек, а таб может в принципе не вводиться (кнопка будет менять фокус элементов)
Dima T
хоть табуляция непечатный символ, но он копипастится

Ничего не копипастится. Понятие структурированные данные и набор чего-то кривыми руками в редактор ортогональны. Там данные мало того, что будут не правильно структурированы, так там еще атрибуты записей никогда не будут соответствовать своему домену.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047433
PetroNotC Sharp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima T,
Ну как в нашем тысячилетиии без ГУИ?)
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047454
petrav
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima T

В TSV тоже может быть подобное, хоть табуляция непечатный символ, но он копипастится, и этим способом попадает в БД, но тут проблемы только в одной строке, следующие грузятся, и источник проблемы проще искать.

Копипастится и попадает в БД? Прикольно вы работаете. LOL.
А у вас там SQL injection случайно в БД не попадает?

Я уж не говорю про то, что если проблемы в одной строке, то скорее всего вы эту ошибку никогда не найдёте.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047476
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
petrav
Dima T

В TSV тоже может быть подобное, хоть табуляция непечатный символ, но он копипастится, и этим способом попадает в БД, но тут проблемы только в одной строке, следующие грузятся, и источник проблемы проще искать.

Копипастится и попадает в БД? Прикольно вы работаете. LOL.
А у вас там SQL injection случайно в БД не попадает?

Я уж не говорю про то, что если проблемы в одной строке, то скорее всего вы эту ошибку никогда не найдёте.

Это не мы. Мы выгрузку из той БД получаем с наездом что наша прога их файлик грузить не хочет.
Ищется элементарно, если знаешь как в hex-редакторе посмотреть.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047481
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster

Что там у местного парсера таблички с многосточными значениями? Всё ожидаемо плохо? Почему не прикрутили нормальный парсер? Правильно, нахера делать нормальные человеческие эскейпы для спецсимволов, давайте херачить всё в двоичном виде и обламываться.

[src]
12"12""34"


Ну и зачем ты это написал? Это доказательство в стиле Паниковского.
...
Рейтинг: 0 / 0
Заменить запись в файл с txt на xlsx
    #40047484
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
crutchmaster
mayton
Сложность парсера не имеет значения. Это его, парсера responsibility.

Ровно до тех пор, пока функционал парсера тебя устраивает и пока этот парсер доступен.

Почему он станет недоступен? 6 тысяч CSV-парсеров с исходным кодом почти под все языки. Бери-нехочу.

https://github.com/search?q=csv parser

А хотя-бы и не было. Неужели сам бы не написал? Стандарт описан. Несложный.
...
Рейтинг: 0 / 0
25 сообщений из 150, страница 2 из 6
Форумы / C++ [игнор отключен] [закрыт для гостей] / Заменить запись в файл с txt на xlsx
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]