Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
EDUARD SAPOTSKIhVosttну так помоги человеку, выкати одно из своих десятков. или только языком молоть горазд? Готовый скрипт не выкачу, пока они мне денюжку приносят, да и задачи не знаю и всех данных не вижу. Но в общем алгоритм прост - сначала шум убираешь, заменяешь все спецсимволы, знаки препинания на пробелы, удаляешь двойные пробелы, все в нижний регистр, один язык, дальше делим по ключевым словам... ну а дальше в зависимости от задачи... Проще это делать на T-SQL(для меня). Если сложные алгоритмы нужно применить, то есть смысл выгрузить в приложение и прогнать через алгоритм на C#. Универсального скрипта для таких задач не существует, всегда приходится что-то допиливать. Если уже действительно лингвистический анализ нужен, то в нете можно нарыть больше 10-ка различных алгоритмов, один в чем-то лучше, другой в другом, приходится их комбинировать... но это не тот случай, думаю здесь все просто. А на sql в сторону регулярок копать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 16:31 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
УКРОП_А на sql в сторону регулярок копать? да, обычный replace и регулярки, кстати вот здесь много чего интересного по этому делу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 16:36 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
EDUARD SAPOTSKIУКРОП_А на sql в сторону регулярок копать? да, обычный replace и регулярки, кстати вот здесь много чего интересного по этому делу. спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 16:38 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
УКРОП_, ...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем .... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 18:10 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
carrotikУКРОП_, ...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем .... Так я базу взял у УкрПочты и залил в sql, но таких адресов там нет как в паспорте у некоторых людей. Знаю странно звучит но это факт (может они по другому в Укрпочте называются) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 18:27 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
В России есть государственная база КЛАДР - классификатор адресов (вот пример http://www.infokladr.ru/) Это, фактически, стандарт на представление адреса в РФ. У вас разве нет что-нить подобного? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 18:42 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
УКРОП_, чисто из интереса, если 1с пользуются на украине, то можно классификатор отуда взять? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2014, 18:42 |
|
||
|
Распарсить строку адреса
|
|||
|---|---|---|---|
|
#18+
УКРОП_carrotikУКРОП_, ...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем .... Так я базу взял у УкрПочты и залил в sql, но таких адресов там нет как в паспорте у некоторых людей. Знаю странно звучит но это факт (может они по другому в Укрпочте называются) Написал в укр.пошту что у них база хреновая , жди скоро поправят ! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.09.2014, 17:50 |
|
||
|
|

start [/forum/topic.php?fid=18&msg=38751957&tid=1356989]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
33ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
34ms |
get tp. blocked users: |
1ms |
| others: | 223ms |
| total: | 327ms |

| 0 / 0 |
