powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Распарсить строку адреса
8 сообщений из 33, страница 2 из 2
Распарсить строку адреса
    #38751763
УКРОП_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EDUARD SAPOTSKIhVosttну так помоги человеку, выкати одно из своих десятков. или только языком молоть горазд?
Готовый скрипт не выкачу, пока они мне денюжку приносят, да и задачи не знаю и всех данных не вижу.
Но в общем алгоритм прост - сначала шум убираешь, заменяешь все спецсимволы, знаки препинания на пробелы, удаляешь двойные пробелы, все в нижний регистр, один язык, дальше делим по ключевым словам... ну а дальше в зависимости от задачи... Проще это делать на T-SQL(для меня). Если сложные алгоритмы нужно применить, то есть смысл выгрузить в приложение и прогнать через алгоритм на C#. Универсального скрипта для таких задач не существует, всегда приходится что-то допиливать. Если уже действительно лингвистический анализ нужен, то в нете можно нарыть больше 10-ка различных алгоритмов, один в чем-то лучше, другой в другом, приходится их комбинировать... но это не тот случай, думаю здесь все просто.

А на sql в сторону регулярок копать?
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751770
Фотография EDUARD SAPOTSKI
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
УКРОП_А на sql в сторону регулярок копать?
да, обычный replace и регулярки, кстати вот здесь много чего интересного по этому делу.
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751774
УКРОП_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EDUARD SAPOTSKIУКРОП_А на sql в сторону регулярок копать?
да, обычный replace и регулярки, кстати вот здесь много чего интересного по этому делу.

спасибо
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751925
carrotik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
УКРОП_,

...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем ....
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751943
УКРОП_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
carrotikУКРОП_,

...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем ....

Так я базу взял у УкрПочты и залил в sql, но таких адресов там нет как в паспорте у некоторых людей. Знаю странно звучит но это факт (может они по другому в Укрпочте называются)
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751955
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В России есть государственная база КЛАДР - классификатор адресов (вот пример http://www.infokladr.ru/)
Это, фактически, стандарт на представление адреса в РФ.
У вас разве нет что-нить подобного?
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38751957
Фотография Где-то в степи
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
УКРОП_,
чисто из интереса, если 1с пользуются на украине, то можно классификатор отуда взять?
...
Рейтинг: 0 / 0
Распарсить строку адреса
    #38756530
Andrey1306
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
УКРОП_carrotikУКРОП_,

...вообще говоря, поскольку база данных населенных пунктов Украины (а также улиц и т.д) уже (где-то и во многих местах) есть, то есть мнение, что лучше ее скачать и использовать в качестве словаря (как при распознавании текста) ... т.е. как тут говорили - нашли в тексте Макее - ищем в словаре (и он, скорее всего, уже нормализованный) вхождение, и просто подставляем ....

Так я базу взял у УкрПочты и залил в sql, но таких адресов там нет как в паспорте у некоторых людей. Знаю странно звучит но это факт (может они по другому в Укрпочте называются)



Написал в укр.пошту что у них база хреновая , жди скоро поправят !
...
Рейтинг: 0 / 0
8 сообщений из 33, страница 2 из 2
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Распарсить строку адреса
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]