python: скорость выполнения set() для массива / PHP, Perl, Python

ReSQL.ru

2.0.61

Планшетная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / python: скорость выполнения set() для массива / 17 сообщений из 17, страница 1 из 1

21.10.2016, 19:49

#39331906

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

Всем привет,

а может кто прояснить такую ситуацию. По свободе выполняю задачки на hackerrank.com на питоне. Была простая задача - на вход дается строка, нам надо определить является ли она панграммой (т.е. содержит каждую из 26 латинских букв хотя бы раз).

Код: python

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

import string

uniqLetters = 0
pangrams = {}
s = raw_input().lower().replace(" ", "")

for c in s:
    if c not in pangrams.keys():
        pangrams[c] = 1
        uniqLetters += 1
    if uniqLetters == 26:
        break

print ["not pangram", "pangram"][uniqLetters == 26]

После того, как ты решаешь задание, ты можешь посмотреть альтернативные решения. Нашел там такой пример

Код: python

1.
2.
3.

from string import lowercase, lower

print ["not pangram", "pangram"][lowercase == ''.join(sorted(list(set(raw_input().lower())-set(' '))))]

Решил ради интереса проверить скорость работы. И вот тут меня ждало удивление. На строке в 10кк символов, причем последний 26й символ я специально добавлял в конец строки

Код: python

1.
2.

s = ''.join(random.choice(string.ascii_letters[0:25]) for _ in range(10000000))
s = s + "z"

второй вариант отрабатывал намного быстрее - time: 0.2s, мой вариант time: 4.65s.

Собственно вопрос. Как set так быстро удаляет дубликаты? Ведь ему необходимо пройти весь массив. И даже если я в начало массива добавляю саму панграмму, т.е. "thequickbrownfoxjumpsoverthelazydog" все равно ничего не меняется.

Я конечно понимаю, что мой вариант далек от оптимального, но почему такая большая разница?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.10.2016, 20:00

#39331908

FishHook

Участник

Сообщения: 36 601
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ALex_hha,

set не удаляет дубликаты, он их просто не добавляет. И set - это не массив, это хэш-таблица, поиск в ней имеет не линейную, а логарифмическую сложность

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.10.2016, 20:07

#39331910

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

Да я знаю, но ведь set() в любом случае надо обойти всю строку, чтобы быть уверенным, а это 10кк символов? Или там какой то хитрый алгоритм используется

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.10.2016, 20:35

#39331921

Програмёр

Участник

Откуда: Москва
Сообщения: 2 987
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

FishHookALex_hha,

set не удаляет дубликаты, он их просто не добавляет. И set - это не массив, это хэш-таблица, поиск в ней имеет не линейную, а логарифмическую сложность

Небольшая поправка... сложность алгоритма поиска значения по хэштаблице составляет O(1)
Это у бинарного поиска O(log(n))

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.10.2016, 20:52

#39331928

Програмёр

Участник

Откуда: Москва
Сообщения: 2 987
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ALex_hhaВсем привет,

а может кто прояснить такую ситуацию. По свободе выполняю задачки на hackerrank.com на питоне. Была простая задача - на вход дается строка, нам надо определить является ли она панграммой (т.е. содержит каждую из 26 латинских букв хотя бы раз).

Код: python

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

import string

uniqLetters = 0
pangrams = {}
s = raw_input().lower().replace(" ", "")

for c in s:
    if c not in pangrams.keys():
        pangrams[c] = 1
        uniqLetters += 1
    if uniqLetters == 26:
        break

print ["not pangram", "pangram"][uniqLetters == 26]

После того, как ты решаешь задание, ты можешь посмотреть альтернативные решения. Нашел там такой пример

Код: python

1.
2.
3.

from string import lowercase, lower

print ["not pangram", "pangram"][lowercase == ''.join(sorted(list(set(raw_input().lower())-set(' '))))]

Код: python

1.
2.

s = ''.join(random.choice(string.ascii_letters[0:25]) for _ in range(10000000))
s = s + "z"

Код: python

1.
2.

from string import lowercase, lower
print ["not pangram", "pangram"][set(lowercase).issubset(raw_input().lower())]

Зачем столько танцев с бубном-то...какие-то сортировки лишние...

P.S. за hackerrank.com спасибо. Я тоже решил как-раз питон изучать понемногу. Будет где в основах попрактиковаться. А то как известно мы запоминаем всего 10% из прочитанного... Вроде бы вчера треть книги Dive in Python прочитал, а для решения простой задачки пришлось названия методов гуглить всё же :) Без практики "в одно ухо влетело, из другого вылетело" так сказать :)

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

21.10.2016, 21:03

#39331933

Програмёр

Участник

Откуда: Москва
Сообщения: 2 987
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ALex_hhaДа я знаю, но ведь set() в любом случае надо обойти всю строку, чтобы быть уверенным, а это 10кк символов? Или там какой то хитрый алгоритм используется

Всё дело может быть в кодировке. Если эта кодировка не однобайтовая с переменным количеством байт на символ (как utf-8), то для получения символа с позицией 1000 программе надо прочитать все 1000 символов, что бы узнать где он есть и прочитать его. Не знаю как обстоят дела с кодировками с фиксированным размером символов, вероятно они оптимизированы, но не факт.

Множества, списки, словари и т.д. лишены этого недостатка, потому как с ними чётко понятно где искать "следующий" элемент. И тогда получение нужного элемента сводится к сложности O(1),а не O(n) как в строке.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

24.10.2016, 10:57

#39332577

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

Ну конкретно я проверял на обычном ascii тексте, это собственно видно из кода генерации строки

Код: python

s = ''.join(random.choice(string.ascii_letters[0:25]) for _ in range(10000000))

авторМножества, списки, словари и т.д. лишены этого недостатка, потому как с ними чётко понятно где искать "следующий" элемент. И тогда получение нужного элемента сводится к сложности O(1),а не O(n) как в строке.
да, я читал, что списки и словари в питоне оптимизированы по самое немогу :) Как написали на SO - "Dictionaries are one of the more heavily tuned parts of Python, since they underlie so much of the language."

Кстати, а сама операция преобразования строки во множество или список/словарь она не является затратной?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

24.10.2016, 23:07

#39333176

Програмёр

Участник

Откуда: Москва
Сообщения: 2 987
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ALex_hhaНу конкретно я проверял на обычном ascii тексте, это собственно видно из кода генерации строки

Код: python

s = ''.join(random.choice(string.ascii_letters[0:25]) for _ in range(10000000))

Код: python

1.
2.
3.
4.
5.
6.
7.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000
k = set()
for c in str1:
    k.add(c)

Код: python

1.
2.
3.
4.
5.
6.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000
k = set()
k = set(str1)

Код: python

1.
2.
3.
4.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000

моя консоль$ time ./str.py

real 0m6.835s
user 0m6.812s
sys 0m0.032s

$ time ./str2.py

real 0m0.975s
user 0m0.940s
sys 0m0.036s

$ time ./empty.py

real 0m0.113s
user 0m0.024s
sys 0m0.088s

Итак, имеем следующие данные:
1. Строка в 100 000 000 символов создаётся в течении 0.024s . Что логично, учитывая что запись в ячейку памяти это 1 или 2 такта (не вспомню уже), то процессор может за секунду заполнить 6 гигабайт памяти (мы же заполняем значительно меньший объём, всего 100 Мб)
2. Строка в 100 000 000 символов переводится во множество в течении где-то 0.940s. По сути то же чтение и заполнение ячеек памяти, только + механизм вычисления хэш функции для каждой операции записи
3. А вот перебор строки в цикле ведёт к увеличению затрат ещё на 6 секунд.

Теперь надо определить, эта задержка обусловлена циклом как таковым (расходами на его работу в питоне) или же она вызвана именно работой со строкой.

Берём ещё файл (rng.py):

Код: python

1.
2.
3.
4.
5.
6.
7.

#!/usr/bin/python2.7
import string

str1 = ['a']*100000000
k = set()
for c in str1:
    k.add(c)

и меряем скорость перебора не строки, а списка:
консоль$ time ./rng.py

real 0m7.397s
user 0m7.204s
sys 0m0.200s

Ничего не поменялось... всё те же 7 секунд (плюс-минус). Тут я сам был удивлён, потому что изначальное предположение по поводу строк оказалось ошибочным. Дело не в строке, а в цикле! Для перебора множества ситуация тоже не меняется.

После этого я уже начал экспериментировать и нарвался на ожидаемый, но совсем неочевидный эффект. Смотрим файл rng2.py:

Код: python

1.
2.
3.
4.
5.
6.

#!/usr/bin/python2.7
import string

str1 = ['a']*100000000
k = set()
k = {c for c in str1}

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 11:09

#39333355

alex564657498765453

Участник

Сообщения: 1 942
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

и что никого не смутило, что автор сам реализует механизм получения уникального списка, а в примере в одну строчку - это делает скомпилированый код??? ну как бы компилированый код всегда работает быстрее интерпретируемого - и никакие байткоды и оптимизации тут не помогут.

ЗЫ может создатель библиотеки где клас Set описан...так вообще на ассемблере вставки пили, там быстродействие достигает теоретического максимума.

ЗЫЗЫ автор однострочного я так понял не расматривает наличие тире и прочего...

так что наверно надо брать пересечение = множество уникальных значений /\ множество букв алфавита и его длина должна быть равно длинне множества букв алфавита. поди и быстрее будет.(в сравнение с доработаным примером однострочным - отнимать не только пробел а и остальные символы которые могут встретится.)

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 11:14

#39333364

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

Спасибо интересно.

авторstr1 = 'a'*100000000
но вот тут мне кажется немного не честно генерить строку с одинаковых символов, а потом на нее натравливать set() ;)

А пробовали генерить таки рандомные символы, результат будет таким же?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 11:18

#39333365

alex564657498765453

Участник

Сообщения: 1 942
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

раз уж тут туса питонщиков(я не знаю питон вообще)

погуглил документацию... вот в упор не нашол где бы чётко было написано, если конструктору класса Set передать строку, то он создаст множество символов этой строки. там написано только создание с помощьью перечисления через запятую, или по типуset(x for x in 'i love you' if x not in ' -' )

может я не правильную документацию читаю? или чего из вида упустил. но вот по пхп томуже, джаваскрипту, или библиотеке гуглится легко документация где будет чётко

фнукция(-список-параметров): тип результата
описание что делает
описание параметров
описание результата
примеры использования

если класс
то перечисление полей методов, дальше по кажомупу полю методу как про функцию /глобальную коснтанту - чётко что и для чего.

по классу чётко описан конструктор(ы)...

а тут както трудно сбухты барахты чтото найти в документации по питону.

??

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 11:21

#39333373

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

авторЗЫЗЫ автор однострочного я так понял не расматривает наличие тире и прочего...
по условию на входе могут быть строчные, заглавные и пробелы.

авторConstraints
Length of can be at most and it may contain spaces, lower case and upper case letters . Lower-case and upper-case instances of a letter are considered the same.

автори что никого не смутило, что автор сам реализует механизм получения уникального списка
Ну не списка, а строки ;) А вы предлагаете вводить 10кк символов с клавиатуры? :D

авторв сравнение с доработаным примером однострочным - отнимать не только пробел а и остальные символы которые могут встретится.)
в идеале пожалуй да, если в условии не было бы оговорено, что именно может быть на входе.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 11:27

#39333382

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

авторвот в упор не нашол где бы чётко было написано, если конструктору класса Set передать строку, то он создаст множество символов этой строки
ну в самом описании конструктора есть комментарий - "Build an unordered collection of unique elements."

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 12:29

#39333477

alex564657498765453

Участник

Сообщения: 1 942
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ALex_hhaавторвот в упор не нашол где бы чётко было написано, если конструктору класса Set передать строку, то он создаст множество символов этой строки
ну в самом описании конструктора есть комментарий - "Build an unordered collection of unique elements."

так что делает конструктор и так понятно, но из чего он это делает?

вот масив на вход он примет? а обьект по которому можно как по масиву пройтись???

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 12:47

#39333502

alex564657498765453

Участник

Сообщения: 1 942
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

ПрограмёрALex_hhaНу конкретно я проверял на обычном ascii тексте, это собственно видно из кода генерации строки

Код: python

s = ''.join(random.choice(string.ascii_letters[0:25]) for _ in range(10000000))

пропущено...

да, я читал, что списки и словари в питоне оптимизированы по самое немогу :) Как написали на SO - "Dictionaries are one of the more heavily tuned parts of Python, since they underlie so much of the language."

Кстати, а сама операция преобразования строки во множество или список/словарь она не является затратной?

проверил :) нет... не является

Итак, берём 3 файла (str.py, str2.py, empty.py... исходники в той же последовательности):

Код: python

1.
2.
3.
4.
5.
6.
7.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000
k = set()
for c in str1:
    k.add(c)

Код: python

1.
2.
3.
4.
5.
6.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000
k = set()
k = set(str1)

Код: python

1.
2.
3.
4.

#!/usr/bin/python2.7
import string

str1 = 'a'*100000000

Код: python

1.
2.
3.
4.
5.
6.
7.

#!/usr/bin/python2.7
import string

str1 = ['a']*100000000
k = set()
for c in str1:
    k.add(c)

Код: python

1.
2.
3.
4.
5.
6.

#!/usr/bin/python2.7
import string

str1 = ['a']*100000000
k = set()
k = {c for c in str1}

Результат:
консоль$ time ./rng2.py

real 0m2.744s
user 0m2.572s
sys 0m0.172s

ТАДАААААМ!!! Тернарный оператор for...in даёт нам оптимизацию вдвое (разумеется это так сильно заметно только из-за простоты выполняемых операций). Исходя из последнего опыта можно предположить, что очень много времени терялось на создании отдельного объекта строки "с" для каждой конкретной итерации. И при использовании тернарной операции похоже этого не происходит и каждое следующее значение передаётся напрямую в функцию добавления значения во множество. То есть вместо создания объекта строки для переменной "c", а потом ещё его дублирования для записи во множество, теперь происходит создание только одного экземпляра объекта, что изрядно экономит время :)

P.S. Как помним, в питоне всё является объектами. Потому для ускорения работы очень больших циклов, похоже, следует использовать тернарные операции for...in по возможности. Проверял на практике, с числами та же хрень например.

========
больше похоже на подгон под ответ.

1)не важно сколько тактов занимает действие на микропроцессоре, шина обмена с памятью в раз 20 медленее, поэтому там что 2 что 5 тактов - побую, шина влюбом случае будет скорость лимитирующим фактором

2)один такт идёт на декодирование команды, адрес в память строится сегмент смещение, это два регистра выставить на микропроцессоре недо, плюс сама отправка - это если отослать байт в адресс.

3)но 2 сдесь бесмсленно - вы пишете на питоне, ядро которого написано на си наврено, влюбом случае не на ассемблере, так что рассуждать в такие дебри безперспективно

4)подозреваю что команда продублировать 100 000 000 раз один символ будет оптимизирована...ведь соверменная память умеет копировать участки без участия микропроцессора.

ну тоесть микропроцессору не обязательно 100 млн раз отправлять байт в память по адресу.

можно выделить память(скорей всего это не один сплошной кусок будет - но тут не важно) и оставить сразу строку сразу на 8 байт(для 64 битнйо системы) и начиная с этого момента, копировать куски оперативки в оперативку..

5)ваши замеры на питоне как что работает безперспективны. условие -любое, это очень заратная операция для микропроцессора. очень затратная, легче 100 сложений сделать чем одно условие (я про код на ассемблере) - по сути, весь ваш код на питоне, наш на пхп и подобных языках медленее кода написаного толково и скомпиленого толковым компилятором на Си обуславливается именно этими условиями - что в том коде вы на прямую работаете с памятью, и любое действие с чтением присвоением - это работа с адресами в память, вто время как на интерпретируемых языках, это всё проходит через таблицу переменных, а там как ни крути условия будут - ну как минимум проверить наличие переменной, подходящесть типа...

поэтому пытаться чтото сравнивать так дотошно на таком языке как питон - безперспективно.

сравнивать можно различные языковые конструкции, делающие одно и тоже, но никак не то что насравнивали вы.
6)
а рассуждения чесно говоря иногда удивляют...фраза - по сути тоже чтение только есчо вычисление хеш функции... тут какбы ситуация такая, что уже болт забить можно на чтение или не чтение...выщитывать хешфункцию - это основная задача
-- и вот тут можете написать сравнительный тест, в милион ячеек в цикле записать числа от 1 до 1000000, тоже только рандомное число(сохранять всегда ввиде текста число) - и тоже, но хеш значение

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 13:32

#39333544

ALex_hha

Участник

Откуда: Украина. Харьков.
Сообщения: 2 951
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

автортак что делает конструктор и так понятно, но из чего он это делает?
вот масив на вход он примет? а обьект по которому можно как по масиву пройтись???
насколько я понимаю, любой итерируемый объект.

Код: python

1.
2.
3.
4.
5.
6.
7.
8.
9.

>>>list1 = [1, 2, 3, 4, 5, 6, 7]
>>> print set(list1)
set([1, 2, 3, 4, 5, 6, 7])

>>> n = 1234567
>>> print set(n)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable

автор-- и вот тут можете написать сравнительный тест, в милион ячеек в цикле записать числа от 1 до 1000000, тоже только рандомное число(сохранять всегда ввиде текста число) - и тоже, но хеш значение
надо только не забывать, что простые числа в питоне кешируются ;)

Код: python

1.
2.
3.
4.
5.
6.
7.
8.
9.

import sys
list1 = [1, 2, 3, 4, 5, 6, 7]
n = 3

print sys.getrefcount(list1)
print sys.getrefcount(n)

2
35

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

25.10.2016, 20:54

#39333944

Програмёр

Участник

Откуда: Москва
Сообщения: 2 987
Рейтинг: 0 / 0

python: скорость выполнения set() для массива

alex564657498765453,

некоторые замечания уместны, разумеется.... Некоторые не очень :)
Но я это делал не для того, что бы ответ под результат подогнать. Я это делал что бы понять что именно столько времени пожирает в программе. И выяснил. По сути поставленную перед собой задачу выполнил и поделился с другими.

Я тоже вроде как с питоном только начинаю знакомиться, потому такие моменты меня очень интересуют... и помогают глубже вникнуть в происходящее.

Насчёт копирования памяти. Возможно Вы правы, но я сомневаюсь (погуглю как-нить на досуге). Дело в том, что такое поведение оперативной памяти сделало бы её асинхронной, а это явное усложнение процесса программирования, потому как изменение некоторой ячейки или ячеек памяти и использование установленного значения в следующей команде могло бы завершиться ошибкой логики или вообще выбросом исключения. Это бы привело к необходимости проверять готовность памяти перед каждой операцией её чтения или записи. :) Мне при ознакомлении с ассемблером хватило этих глупостей с проверкой готовности результатов от сопроцессора (числа с плавающей точкой) и готовности данных при работе со считывающими или запоминающими устройствами (жёсткие диски, CD привод и т.д.) Знаете... это не лучшая практика... и актуальна только в случаях экономии большого количества времени. Заполнение больших структур данных в оперативной памяти является нечастым, а скорость этой операции итак достаточно высокая, потому очень сомневаюсь что кто-то будет вводить такие сложности ради иллюзорной экономии процессорного времени.

"тут какбы ситуация такая, что уже болт забить можно на чтение или не чтение...выщитывать хешфункцию - это основная задача" - так и есть... потому то она и занимает в 40 раз больше времени чем обычная запись. Не понимаю суть замечания...

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/search_topic.php?author=rep_user&author_mode=last_topics&do_search=1]:	0ms
get settings:	8ms
get forum list:	19ms
get settings:	9ms
get forum list:	18ms
check forum access:	3ms
check topic access:	3ms
track hit:	184ms
get topic data:	10ms
get forum data:	2ms
get page messages:	55ms
get tp. blocked users:	1ms
others:	698ms

total:	1010ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы