|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Имеется csv файл с заранее неопределенным количеством строк и "столбцов". Требуется по определенному алгоритму (пока не известен, но не в этом суть) обработать данные из файла. Например, подсчитать среднеарифметическое всех чисел из файла. Где лучше хранить данные из файла? В субд как вариант, но тогда придется ставить субд на машину. В памяти - неизвестен заранее размер файла, может и памяти не хватит. Построчное чтение и обработка не подходит. Есть еще варианты? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 10:30 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixИмеется csv файл с заранее неопределенным количеством строк и "столбцов". Требуется по определенному алгоритму (пока не известен, но не в этом суть) обработать данные из файла. Например, подсчитать среднеарифметическое всех чисел из файла. Где лучше хранить данные из файла? В субд как вариант, но тогда придется ставить субд на машину. В памяти - неизвестен заранее размер файла, может и памяти не хватит. Построчное чтение и обработка не подходит. Есть еще варианты? не нужно засовывать в память весь файл , обрабатывай его построчно. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 10:32 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixПострочное чтение и обработка не подходит. Почему нет? Есть еще варианты? Разбить на несколько мелких файлов, каждый их которых поместится в памяти, обработать поочередно ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 10:33 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixТребуется по определенному алгоритму (пока не известен, но не в этом суть) обработать данные из файла. Суть именно в этом. Сначала надо определиться "что делать", а потом выбирать "как делать". saxixВ субд как вариант, но тогда придется ставить субд на машину. Можно без полноценной СУБД обойтись, взять, например, sqlite или что-то подобное. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 10:42 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
pationsaxixИмеется csv файл с заранее неопределенным количеством строк и "столбцов". Требуется по определенному алгоритму (пока не известен, но не в этом суть) обработать данные из файла. Например, подсчитать среднеарифметическое всех чисел из файла. Где лучше хранить данные из файла? В субд как вариант, но тогда придется ставить субд на машину. В памяти - неизвестен заранее размер файла, может и памяти не хватит. Построчное чтение и обработка не подходит. Есть еще варианты? не нужно засовывать в память весь файл , обрабатывай его построчно. Потому что на один файл, возможно, несколько инструкций для обработки, которые нельзя будет выполнять одновременно. Тогда придется файл перебирать построчно несколько раз. Вообще пока нет представления о размере файла и алгоритме обработки, просто присматриваю "технологии" ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:12 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixПотому что на один файл, возможно, несколько инструкций для обработки, которые нельзя будет выполнять одновременно. это почему нельзя? один итератор, несколько подписчиков, например ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:15 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
ИзопропилsaxixПотому что на один файл, возможно, несколько инструкций для обработки, которые нельзя будет выполнять одновременно. это почему нельзя? один итератор, несколько подписчиков, например Задача пока стоит невнятная, но типа....сначала подсчитали одно, через пять минут понадобилось другое. И заранее все алгоритмы обработки не известны. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:19 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixЗадача пока стоит невнятная, но типа....сначала подсчитали одно, через пять минут понадобилось другое. И заранее все алгоритмы обработки не известны. Значит либо в память inmemory db ну либо свои структуры, либо локальная [no]sql базенка... чтоб каждый раз не умирать на чтении и парсинге... ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:24 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxix, ...да хоть в DBF - старо как мир, но драйвера ADODB в любой винде присутствуют ... ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:31 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
buserлибо локальная [no]sql базенка... мне сдаётся, что лучше SQL , ибо запросы предполагаются случайные ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:32 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
carrotik...да хоть в DBF - старо как мир, но драйвера ADODB в любой винде присутствуют ... только этого геморроя не хватает ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:33 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Изопропилcarrotik...да хоть в DBF - старо как мир, но драйвера ADODB в любой винде присутствуют ... только этого геморроя не хватает ...автор не хотел ставить даже Express версии SQL/Firebird, если я правильно понял .... ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:34 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
carrotik...автор не хотел ставить даже Express версии SQL/Firebird, если я правильно понял .... правильно. embedded СУБД применить нужно ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:36 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Счас смотрю в сторону sqlLite ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:37 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
carrotikИзопропилпропущено... только этого геморроя не хватает ...автор не хотел ставить даже Express версии SQL/Firebird, если я правильно понял .... Да мне то все равно, но по требованиям - как можно меньше телодвижений для админов ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 11:38 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Изопропилcarrotik...автор не хотел ставить даже Express версии SQL/Firebird, если я правильно понял .... правильно. embedded СУБД применить нужно у firebird есть embedded ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 12:00 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixИмеется csv файл с заранее неопределенным количеством строк и "столбцов". Требуется по определенному алгоритму (пока не известен, но не в этом суть) обработать данные из файла. Например, подсчитать среднеарифметическое всех чисел из файла. Где лучше хранить данные из файла? В субд как вариант, но тогда придется ставить субд на машину. В памяти - неизвестен заранее размер файла, может и памяти не хватит. Построчное чтение и обработка не подходит. Есть еще варианты? Если есть файл, и он может быть такого размера, что в оперативку не влазит, то можно MemoryMappedFiles использовать. Если же с этим файлом предполагается интенсивная разнообразная работа, то проще загрузить в любую СУБД и оперировать SQL-запросами ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:39 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
OLEDB вполне себе нормально с CSV работает ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:53 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Попробовал sqlLite и грузить данные через insert into....скорость около 1000 записей в минуту ((( ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:54 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Arm79Если же с этим файлом предполагается интенсивная разнообразная работа, то проще загрузить в любую СУБД и оперировать SQL-запросами +1 BCP-загрузка шустро работает ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:54 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Cat2OLEDB вполне себе нормально с CSV работает с каим провайдером? ЗЫ какое ещё извращение будет предложено? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:55 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
saxixПопробовал sqlLite и грузить данные через insert into....скорость около 1000 записей в минуту ((( bulk insert - bcp !!! ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 15:59 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Cat2saxixПопробовал sqlLite и грузить данные через insert into....скорость около 1000 записей в минуту ((( bulk insert - bcp !!! Это в MS SQL ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 16:01 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
Cat2saxixПопробовал sqlLite и грузить данные через insert into....скорость около 1000 записей в минуту ((( bulk insert - bcp !!! авторCSV Import Use the ".import" command to import CSV (comma separated value) data into an SQLite table. The ".import" command takes two arguments which are the name of the disk file from which CSV data is to be read and the name of the SQLite table into which the CSV data is to be inserted. Note that it is important to set the "mode" to "csv" before running the ".import" command. This is necessary to prevent the command-line shell from trying to interpret the input file text as some other format. sqlite> .mode csv sqlite> .import C:/work/somedata.csv tab1 There are two cases to consider: (1) Table "tab1" does not previously exist and (2) table "tab1" does already exist. In the first case, when the table does not previously exist, the table is automatically created and the content of the first row of the input CSV file is used to determine the name of all the columns in the table. In other words, if the table does not previously exist, the first row of the CSV file is interpreted to be column names and the actual data starts on the second row of the CSV file. For the second case, when the table already exists, every row of the CSV file, including the first row, is assumed to be actual content. If the CSV file contains an initial row of column labels, that row will be read as data and inserted into the table. To avoid this, make sure that table does not previously exist. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 16:03 |
|
Загрузка и обработка данных из текстового файла большого размера
|
|||
---|---|---|---|
#18+
ИзопропилCat2OLEDB вполне себе нормально с CSV работает с каим провайдером? ЗЫ какое ещё извращение будет предложено? Тьфу. ODBC Driver={Microsoft Text Driver (*.txt; *.csv)};DBQ=d:\bin https://msdn.microsoft.com/ru-ru/library/vstudio/ms254500(v=vs.100).aspx ... |
|||
:
Нравится:
Не нравится:
|
|||
13.07.2015, 16:09 |
|
|
start [/forum/topic.php?fid=20&tid=1401345]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
36ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
48ms |
get tp. blocked users: |
1ms |
others: | 377ms |
total: | 502ms |
0 / 0 |