|
|
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
посмотрел, почитал, попробую с байтами напрямую поработать. Текст представлен массивом байт, а там уже перевод в строку много времени занимает. Накидали мне путей решения, буду пробовать что мне конкретно подойдет. Всем спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 16:23 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
Dmitry Arefiev, не биг дата)) тестовые данные раскрыть не могу, ripe похож просто по структуре но не один в один ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 16:26 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
Dimitry Sibiryakov, Скорее всего у него проблема где - то в другом, совершенно не в регулярках. А если и в них, то в шаблоне ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 16:45 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
cptngrb, Не работай с string, работай с PWideChar и никаких конвертаций не будет Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 16:51 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
cptngrb Dmitry Arefiev, Объект inetnum Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. Объект route Код: plaintext 1. 2. 3. тут регулярки не нужны, т.к. есть четко определенные разделители в виде двоеточия и сколько там пробелов - это уже не важно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 19:14 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
Человек любит регулярки. Что тут поделать. Пускай сделает на них. Не устроит - будем искать причины performance issues. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 19:34 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
mayton, Я бы не доверял ТС насчёт регулярок. Какие - то регулярки, чего - то медленно. Почему бы не классический TRegEx http://docwiki.embarcadero.com/Libraries/Rio/en/System.RegularExpressions.TRegEx.Matches ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 19:53 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
Прошли сутки с момента публикации топика. Я-бы уже написал работающее решение. Афтор. Что у тебя уже есть написанного? Заготовочка. Макет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 19:58 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
mayton, пока написал в лоб разбор по байтно, сейчас тестирую на правильность, сравниваю с результатом регулярки ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 20:30 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
ВсеРазумный, ansichar достаточно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 20:34 |
|
||
|
Быстрый парсер в потоках
|
|||
|---|---|---|---|
|
#18+
cptngrb, 22130116 То есть всё будет на английском без иероглифов и так далее ?Ну тогда следи что бы ничего лишнего в базу не залетало ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2020, 20:54 |
|
||
|
|

start [/forum/topic.php?fid=58&gotonew=1&tid=2038340]: |
0ms |
get settings: |
7ms |
get forum list: |
18ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
196ms |
get topic data: |
9ms |
get first new msg: |
6ms |
get forum data: |
2ms |
get page messages: |
49ms |
get tp. blocked users: |
1ms |
| others: | 230ms |
| total: | 524ms |

| 0 / 0 |
