powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Быстрый парсер текста
25 сообщений из 65, страница 2 из 3
Быстрый парсер текста
    #40007588
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

Теоретически, теория и практика не различаются, но на практике, теория и практика различаются
Теоретически хорошая концепция убьётся об рутину менеджмента памяти, тем более на многопоточных приложениях )
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007619
Fr0sT-Brutal
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Можно у mORMot посмотреть, они здорово заморачиваются насчет скорости
https://raw.githubusercontent.com/synopse/mORMot/master/SynCommons.pas
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007625
ъъъъъ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Fr0sT-Brutal,

какая к черту "скорость", если автор ничего не знает ни о требованиях, ни о реальных входных объемах.
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007632
cptngrb
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ъъъъъ, если я их не говорю, не значит, что я их не знаю.

я спросил ровно то, что хотел спросил. решение нашел.

synopse молодцы

основная мысль - меньше строк в потоках.
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007635
cptngrb
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
насчет скорости/производительности. 5 потоков парсинга при работе с сообщением как с текстом не поднимали загрузку CPU больше 30% и не успевали разбирать, а при работе с сообщением как с массивом байт загрузка CPU 55% и успевают.
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007636
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
cptngrb,

Здесь не очень жалуют оптимизаторов. Заходи на Delphi Community в телеге - там больше возможностей дать тебе оперативный ответ по оптимизациям
Кстати скоро будет очередной релиз Tiny.Library - там отпишу
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007637
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU
kealon(Ruslan),

Теоретически, теория и практика не различаются, но на практике, теория и практика различаются
Теоретически хорошая концепция убьётся об рутину менеджмента памяти, тем более на многопоточных приложениях )
не, практически всегда всё убивается в интерфейсе между креслом и монитором - лексер всего лишь выдаёт интервалы лексем в строке и их тип.
а всё что с этим уже делается, к оценке не относится
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007639
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

Да ладно
Давай устроим батл
Ты будешь выдавать строки, а я задействую CachedTexts )
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007644
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU,

зачем выдавать строки? ты же с лексером сравниваться хочешь, он тип лексем выдаёт
все pas-файлы с папки "C:\Program Files (x86)\Embarcadero\Studio\*\source\"
у меня даже готовое где-то было, а то это у тебя времени много

хотя мне кажется с лексером всё упрётся в чтение диска
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007647
cptngrb
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU, среди кучи говна в ответах часто встречаются стоящие советы
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007648
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

А лексемы не используют строки?
Кстати по поводу диска. Судя по описанию, документы приходят по сети, значит можно замерять чтение из памяти
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007655
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU
kealon(Ruslan),

А лексемы не используют строки?
Кстати по поводу диска. Судя по описанию, документы приходят по сети, значит можно замерять чтение из памяти
ты такие вопросы задаёшь, сам смотри, классический вариант функции лексера тынц
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007662
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

Это прекрасно всё
Только как ты будешь обрабатывать даты, числа, ФИО?
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007669
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU
kealon(Ruslan),

Это прекрасно всё
Только как ты будешь обрабатывать даты, числа, ФИО?
я никак, это же не функции лексера

его функция - выделить "слова", а что ты там с ними будешь делать, это уже другой вопрос
хоть те же функции из mORMot возьми для обработки
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007675
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

Вопрос тот же
Давай с тебя лексер + mORMot
С меня CachedTexts :)
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007680
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOU
kealon(Ruslan),

Вопрос тот же
Давай с тебя лексер + mORMot
С меня CachedTexts :)
ты какого-то сферического коня загонять собрался
что конкретно ты собрался парсить?
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007686
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kealon(Ruslan),

У автора можно взять тестовые данные
Документов 10 загнать в память и пропарсить 100500 раз
Из разных потоков
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007688
Фотография Дегтярев Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
> У автора можно взять тестовые данные
он прям разбежался
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007689
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дегтярев Евгений,

Пусть тестовый пример зафигачит с несколькими потоками
Ему же нужен быстрый парсер
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007690
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOUЕму же нужен быстрый парсер

Он думает, что ему нужен быстрый парсер, но, скорее всего, он ошибается.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007692
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakov,

Судя по этому 22212530 нужен
Ну и даже если не нужен, программерские батлы, если по результату появляются новые знания - хороши
Это нормально иногда мериться письками
Программерскими )
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007694
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
12.10.2020 13:07, Dimitry Sibiryakov пишет:
> Он думает, что ему нужен быстрый парсер, но, скорее всего, он ошибается.

я восхищен!
так культурно и завуалировано дать понять, что КГ/АМ...
я б так не смог
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007733
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
cptngrb
насчет скорости/производительности. 5 потоков парсинга при работе с сообщением как с текстом не поднимали загрузку CPU больше 30% и не успевали разбирать, а при работе с сообщением как с массивом байт загрузка CPU 55% и успевают.
это менеджер памяти так себя проявляет
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007742
white_nigger
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А я рад за пропускную способность сетки ТСа)) так накидывать данные, что парсер загинается. По-ходу системы видеонаблюдений отдыхают))
...
Рейтинг: 0 / 0
Быстрый парсер текста
    #40007749
Fr0sT-Brutal
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
cptngrb
основная мысль - меньше строк в потоках.

Да, т.к. это основной perf-киллер. Выделить строку, заполнить, помацать счетчик ссылок через блокировку, удалить строку... парсинг по месту конечно быстрее будет
...
Рейтинг: 0 / 0
25 сообщений из 65, страница 2 из 3
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Быстрый парсер текста
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]