Подскажите самые быстрые коллекции / WinForms, .Net Framework

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Подскажите самые быстрые коллекции

25 сообщений из 42, страница 1 из 2

все

Подскажите самые быстрые коллекции

#39176236

Alexander_fx

Участник

Сообщения: 655

Рейтинг: 0 / 0

привет
Работаю с биржевыми данными
данных много - 30 000 000 экземпляров записей
в каждом экземпляре есть поле - цена - тип Double
необходимо иметь быстрый доступ к экземпляру по цене
dictionary of double на мой взгляд работает медленно
подскажите есть ли что то быстрее
может есть специализированные библиотеки сторонних производителей.
или может кто то видел библиотеки для работы с большими обьемами данных.
Спасибо.

...

Рейтинг:

0 / 0

20.02.2016, 18:07

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176247

L.Otujktd

Гость

Alexander_fx,
Ограничение по используемой памяти есть ?
Чтение будет последовательным или произвольным?
Я бы привязывал не к цене а к диапазонам цен, но нужно понять распределение по ценам.
Я так понимаю для целей производительности нужно узкоспециализированное решение...
Ну и нужно тест использования алгоритма для определения прироста производительности.

...

Рейтинг:

0 / 0

20.02.2016, 18:27

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176252

ViPRos

Участник

Сообщения: 9 731

Рейтинг: 0 / 0

Alexander_fx,

секционируй

...

Рейтинг:

0 / 0

20.02.2016, 18:29

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176260

Alexander_fx

Участник

Сообщения: 655

Рейтинг: 0 / 0

L.Otujktd,

памяти много - готовы жертвовать памятью в угоду скорости.
чтение произвольное - заполнение массива тоже произвольное

...

Рейтинг:

0 / 0

20.02.2016, 18:41

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176261

Alexander_fx

Участник

Сообщения: 655

Рейтинг: 0 / 0

ViPRosAlexander_fx,

секционируй

а что это даст в плане скорости?

...

Рейтинг:

0 / 0

20.02.2016, 18:41

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176266

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

в данном случае я бы рекомендовал AVL-дерево.
Если биржевые данные, то количество позиций после запятой ограничено, Double не нужен.

...

Рейтинг:

0 / 0

20.02.2016, 18:50

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176269

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

или пользуйтесь inmemory db, например extremedb или kdb+. Бесплатных аналогов не знаю

...

Рейтинг:

0 / 0

20.02.2016, 18:52

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176275

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Alexander_fxпривет
в каждом экземпляре есть поле - цена - тип Double

Double неточный тип, его нельзя сравнивать, может просто не найтись. Например при цене 10,30 может оказаться 10,30000000001 != 10,30000000002

Используй Decimal, а лучше перевести в копейки и UInt32 или UInt64 если разрядности UInt32 не хватает.

Вообще тут сортированный по цене массив уместнее, но смотря как он меняется, если постоянно то лучше dictionary

...

Рейтинг:

0 / 0

20.02.2016, 19:09

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176277

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Самое быстрое и неэффективное по памяти - биткарта. Т.е. делаешь массив где цена индекс массива (не dictionary, а просто массив) но тут зависит от диапазона цен. Например если цена в диапазоне 20.00-30.00, то тебе потребуется 1000 элементов массива (20.00, 20.01 и т.д.) независимо от количества значений внутри. Т.е. для поиска надо будет вычислить (value - 20.00) * 100 и получишь индекс нужного элемента. Если диапазон 20.00-2000.00 это уже 198000 элементов.

Алгоритм сложности О(1), т.е. находится все с первого шага. Если памяти хватит.

...

Рейтинг:

0 / 0

20.02.2016, 19:17

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176285

L.Otujktd

Гость

Я так понимаю для фиксированного набора из 30*10^6 записей меняется только цена?
Т.е. основная задача в поиске схожих записей с одинаковым полем Price(выборка по полю)?

...

Рейтинг:

0 / 0

20.02.2016, 19:59

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176288

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

L.OtujktdЯ так понимаю для фиксированного набора из 30*10^6 записей меняется только цена?
Т.е. основная задача в поиске схожих записей с одинаковым полем Price(выборка по полю)?
я так понимаю что Dictionary<Price> не может хранить два одинаковых Price

...

Рейтинг:

0 / 0

20.02.2016, 20:04

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176292

L.Otujktd

Гость

Dima T, очень мало вводной информации по поставленной задаче. А так по описанию тянет на полноценный сервис по поиску, обновлению данных в таблице фиксированного размера.:)

...

Рейтинг:

0 / 0

20.02.2016, 20:16

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176341

Denis.

Участник

Откуда: Москва

Сообщения: 3 300

Рейтинг: 0 / 0

Я думаю что good enough будет цену в копейки и словарь по инту с распараллеливанием алгоритма по возможности.

...

Рейтинг:

0 / 0

21.02.2016, 01:24

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176365

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

Denis.Я думаю что good enough будет цену в копейки и словарь по инту с распараллеливанием алгоритма по возможности.
Какие копейки? Там торгуются инструменты с 4-5 знаков после запятой ))) поэтому словарь - не лучшее решение.

...

Рейтинг:

0 / 0

21.02.2016, 11:21

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176369

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

Можно еще прикинуть, сколько уникальных цен в этом массиве, и сделать битовую маску с разрядностью, равной порядку этого количества. А саму цену переводить в bigint с умножением на 10^5 и использовать ее остаток от деления нацело (используя тот же порядок).

Наверное, это будет самый быстрый доступ к точному значению цены, то если нужна будет выборка по диапазону - толку не будет

...

Рейтинг:

0 / 0

21.02.2016, 11:35

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176373

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Arm79Denis.Я думаю что good enough будет цену в копейки и словарь по инту с распараллеливанием алгоритма по возможности.
Какие копейки? Там торгуются инструменты с 4-5 знаков после запятой ))) поэтому словарь - не лучшее решение.
Int32 это 4 млрд. значений. 9 знаков. Если его хватит, то массив не такой уж и большой будет, при 32-64 Гб оперативки вполне может в памяти уместится.

Я так понял ищется лучшее решение по производительности, остальное не в счет. Массив, с ценой вместо индекса, самое быстрое решение, быстрее невозможно. И параллелить тут нечего.

...

Рейтинг:

0 / 0

21.02.2016, 12:06

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176377

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

Dima TЕсли его хватит, то массив не такой уж и большой будет, при 32-64 Гб оперативки вполне может в памяти уместится.
Проблема в том, что ТС немножко недооценил широту души форумчан, которые и террабайт в оперативку могут запихнуть. А данных там поболее будет, чем 64Гб. Если на каждый чих создавать по 15Гб индекс, то памяти не хватит.

Массив можно уменьшить, если выбрать нормальную хэширующую функцию, вариант я предложил.
AVL-деревья также дают очень быстрый поиск, хотя и не О(1)

А так мое мнение, если позволяют финансы, - использовать in-memory СУБД в виде dll, подключаемой к программе

Ну и можно попробовать использовать Tarantool

...

Рейтинг:

0 / 0

21.02.2016, 12:28

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176383

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Arm79Dima TЕсли его хватит, то массив не такой уж и большой будет, при 32-64 Гб оперативки вполне может в памяти уместится.
Проблема в том, что ТС немножко недооценил широту души форумчан, которые и террабайт в оперативку могут запихнуть. А данных там поболее будет, чем 64Гб. Если на каждый чих создавать по 15Гб индекс, то памяти не хватит.

Arm79Массив можно уменьшить, если выбрать нормальную хэширующую функцию, вариант я предложил.
AVL-деревья также дают очень быстрый поиск, хотя и не О(1)

А так мое мнение, если позволяют финансы, - использовать in-memory СУБД в виде dll, подключаемой к программе

Ну и можно попробовать использовать Tarantool
Dictionary использует хэш-таблицу. Т.е. уже наиболее оптимальный вариант.
Надо затестить насколько тормознее массива.

Тут надо задачу предметнее изучать. Из-за чего именно тормоза. Например если из-за большого количества промахов, т.е. искомое отсутствует, тогда можно биткарту или фильтр Блума применить для предварительной оценки стоит ли искать.

...

Рейтинг:

0 / 0

21.02.2016, 13:07

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176385

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

Arm79которые и террабайт в оперативку могут запихнуть
не вижу проблем с терабайтом (24 планки по 64GB - не требуют космических технологий)

...

Рейтинг:

0 / 0

21.02.2016, 13:12

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176394

Denis.

Участник

Откуда: Москва

Сообщения: 3 300

Рейтинг: 0 / 0

мне кажется что такого решения должно хватать. Если нет, то, возможно, вообще не та среда выбрана.
Если видеть точнее контекст можно делать вариации

Код: c#

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.

  internal sealed class Program
    {
        private const int NUMBERS_COUNT = 30 * 1000 * 1000;
        private static readonly Random randomizer = new Random();

        private static void Main()
        {
            var items = new Item[NUMBERS_COUNT];

            for (var i = 0; i < items.Length; i++)
                items[i] = new Item(randomizer.NextDouble(), string.Empty);

            var dict = new Dictionary<long, List<Item>>();
            foreach (var item in items)
            {
                var key = BitConverter.DoubleToInt64Bits(item.Price);
                List<Item> outItems;
                if (!dict.TryGetValue(key, out outItems))
                {
                    outItems = new List<Item>();
                    dict.Add(key, outItems);
                }
                outItems.Add(item);
            }

            foreach (var value in dict.Values)
                value.TrimExcess();

            //consumme in paralel
            // Parallel.ForEach()
        }

        private sealed class Item
        {
            public Item(double price, string someOtherStuff)
            {
                Price = price;
                SomeOtherStuff = someOtherStuff;
            }

            public double Price { get; }
            public string SomeOtherStuff { get; }
        }
    }

...

Рейтинг:

0 / 0

21.02.2016, 13:50

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176396

Denis.

Участник

Откуда: Москва

Сообщения: 3 300

Рейтинг: 0 / 0

837ms на 20 000 000 элементов

Код: c#

1.
2.
3.
4.
5.
6.
7.
8.

...
   int t = Environment.TickCount;
            Parallel.ForEach(dict.Keys, (key) =>
            {
                bool b = dict.ContainsKey(key);
            });
            t = Environment.TickCount - t;
            Console.WriteLine(t);

...

Рейтинг:

0 / 0

21.02.2016, 14:07

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176397

Denis.

Участник

Откуда: Москва

Сообщения: 3 300

Рейтинг: 0 / 0

если распараллелить чанками наверняка будет быстрее

...

Рейтинг:

0 / 0

21.02.2016, 14:08

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176434

Axeleron

Участник

Откуда: London

Сообщения: 6 513

Рейтинг: 0 / 0

Alexander_fxпривет
Работаю с биржевыми данными
данных много - 30 000 000 экземпляров записей
в каждом экземпляре есть поле - цена - тип Double
необходимо иметь быстрый доступ к экземпляру по цене
dictionary of double на мой взгляд работает медленно
подскажите есть ли что то быстрее
может есть специализированные библиотеки сторонних производителей.
или может кто то видел библиотеки для работы с большими обьемами данных.
Спасибо.
Поверьте, не нужны Вам быстрые коллекции. Выбросьте свою программу с типом данных double для поля цена.

...

Рейтинг:

0 / 0

21.02.2016, 16:20

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176438

Alexander_fx

Участник

Сообщения: 655

Рейтинг: 0 / 0

Всем привет и спасибо за интересное обсуждение.

Пока склоняюсь к бит карте.
диапазон рабочих цен 100 000 экземпляров - так что биткарта не такая уж и большая.
смущало то что в этом диапазоне много разряженностей которые в пустую тратят память но есть большой плюс доступ к элементу по индексу.

...

Рейтинг:

0 / 0

21.02.2016, 16:32

| Ответить | Цитировать | Написать

Подскажите самые быстрые коллекции

#39176498

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Alexander_fxсмущало то что в этом диапазоне много разряженностей которые в пустую тратят память но есть большой плюс доступ к элементу по индексу.
Ты уж определись: быстро или экономно. Если все не влазит в 16-32 Кб (кэш проца), то можно смело размазывать по всей оперативке.

Биткарта на 100000 элементов 12,5 кб. Если добьешься чтобы остальное ее не вытесняло ее из кэша проца, то будет в 2-3 раза быстрее, чем постоянное обращение к памяти.

...

Рейтинг:

0 / 0

21.02.2016, 19:09

| Ответить | Цитировать | Написать

25 сообщений из 42, страница 1 из 2

все

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Подскажите самые быстрые коллекции

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=20&msg=39176434&tid=1400777]:	0ms
get settings:	9ms
get forum list:	12ms
check forum access:	2ms
check topic access:	2ms
track hit:	43ms
get topic data:	10ms
get forum data:	3ms
get page messages:	59ms
get tp. blocked users:	2ms
others:	14ms

total:	156ms