|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Да реализуемое, реализуемо... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 10:01 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinДа реализуемое, реализуемо... Результат непонятен из строки и что время выполнения на 5 строк 1 мин 11 сек не серьезно за это время можно уже 10000 разобрать тем паче на оракле вот такой результат нужен см приложенный файл ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 10:24 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinДа реализуемое, реализуемо... а нет все отлично просто сразу не врубился запятые это пропуск в иерархии так ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 10:44 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Время обработки зависит от правильности и полноты адреса, и совсем не до секунд, когда нужен результат: ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 11:52 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
не отлично !!!!!!!!!!!!!!!!!!! ценю уважаю и спасибо за поддержку а то заклевали блин нельзя не решается но мне заказчик поставил требования 50 000 000-100 000 000 в неделю выхлоп не менее 90% от того что в принципе можно понять и разобрать и с более сложной разноской домов и т.д. и крутись как хочешь да еще долбанутый (в некоторых аспектах sql2000-2005) а кушать то хоца ) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 12:23 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinВремя обработки зависит от правильности и полноты адреса, и совсем не до секунд, когда нужен результат: а чего скажешь насчет такого ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 13:04 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Не могу прочитать *.7z :-((( Zip'ани, пожалуйста... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 13:20 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinНе могу прочитать *.7z :-((( Zip'ани, пожалуйста... можно на мыло а то там больше 100 кб получантся а как то резать не хочется:(( ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 13:30 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Давай в мыло ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 13:36 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinДавай в мыло bug_scorobey@mail.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 13:40 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinДа реализуемое, реализуемо... Оно реализуемо с определенными ограничениями. Которые зависят от задачи. bug_scorobeyАш смешно Адреса "Башкортостан Респ, Уфа г, Александровка, Достоевского ул 1" по КЛАДРу не существует. В д Александровке нет улиц. Зато ул. Достоевского есть в самой Уфе. Таким образом, ваш разбор в "450095,Башкортостан,Респ,Уфимский,р-н,Уфа,г,,,Александровка,д,1,," уже некорректен. Все еще смешно? авторспасибо за поддержку а то заклевали блин нельзя не решается... Сами виноваты - вас спрашивают - как в принципе сделано? В ответ - "используем ODBC, sp_addlinkedserver, все работает и хранится в бинарном ввиду плюс сжатие... ". Отсюда вывод - или человек не знает как это сделано, или не хочет говорить, или этого нету. Nobody faults but mine... (LZ) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 14:30 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
"450095,Башкортостан,Респ,Уфимский,р-н,Уфа,г,,,Александровка,д,1,," уже некорректен :-) Вы невнимательны (либо пользуетесь неактуальным кладром): в кладре ЕСТЬ УЛИЦА Александровка (как и улица Достоевского!), которая и вывелась результатом разбора. Противоречивость адреса решена выбором одной из. Понятно, что о 100% речи не идет (здесь даже человеку сложно решить, чего уж требовать от кода). Но если результ - 90-95% попадания, то смысл "работать железной пиле" определенно есть... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 14:50 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
aag valerytinДа реализуемое, реализуемо... Оно реализуемо с определенными ограничениями. Которые зависят от задачи. bug_scorobeyАш смешно Адреса "Башкортостан Респ, Уфа г, Александровка, Достоевского ул 1" по КЛАДРу не существует. В д Александровке нет улиц. Зато ул. Достоевского есть в самой Уфе. Таким образом, ваш разбор в "450095,Башкортостан,Респ,Уфимский,р-н,Уфа,г,,,Александровка,д,1,," уже некорректен. Все еще смешно? авторспасибо за поддержку а то заклевали блин нельзя не решается... Сами виноваты - вас спрашивают - как в принципе сделано? В ответ - "используем ODBC, sp_addlinkedserver, все работает и хранится в бинарном ввиду плюс сжатие... ". Отсюда вывод - или человек не знает как это сделано, или не хочет говорить, или этого нету. Совершенствуйте методику актуализации адресов а не пользуйтесь только кладром в приложениии чуть сокращенный справочник улиц и домов уфы с этажностью и типом дома Nobody faults but mine... (LZ) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 15:28 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
вот и такое мы стараемся собирать по всей россии где мытьем где катаньем могу выложить всю МО с индексами кому нужно ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 15:30 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
кстати господа не забывайте еще и о переименованиях :)) а то бывае приходят адреса еще со времен СССР откуда берут ума не приложу ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 15:34 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
bug_scorobey aag [] Ну и наконец, главное. КЛАДР меняется каждый год. [] Аш смешно Но не это. Истории-то действительно нет. Хотя и за то, что есть конечно нужно налоговикам спасибо сказать. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 16:40 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
ModelR bug_scorobey aag [] Ну и наконец, главное. КЛАДР меняется каждый год. [] Аш смешно Но не это. Истории-то действительно нет. Хотя и за то, что есть конечно нужно налоговикам спасибо сказать. Привет Нижнему безусловно но бродят разные слухи что к концу 2008 года мы получим прада не от них а от другой гос структуры нечто потрясающее с точки зрения адресов ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 16:44 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
valerytinв кладре ЕСТЬ УЛИЦА Александровка (как и улица Достоевского!), которая и вывелась результатом разбора. Противоречивость адреса решена выбором одной из. В КЛАДРе нет УЛИЦЫ Александровка. В КЛАДРе есть ДЕРЕВНЯ Александровка. И проблема как раз в том что в вашем разборе я не вижу столбца "Противоречевость". Обработав таким образом базу в 2-3 десятка тысяч адресов, я не увижу что некоторые из них были обработаны с 95% вероятностью. Не увижу, потому что в результате преобразования получается формально корректный адрес КЛАДР - но неизвестно, совпадает ли он с исходным по факту. А то, что можно принять некоторые допущения и хорошенько подолбавшись, с какой-то вероятностью (чем дольше долбаться, тем выше) разобрать эти адреса - это да, с этим не спорю. И ваш разбор - навскидку - очень неплохо выглядет. Только перечисленные мной проблемы он не решает. bug_scorobey И что вы хотели сказать этим куском КЛАДРа? Что вы его тоже видели? Не сомневаюсь.. Nobody faults but mine... (LZ) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:03 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
aag valerytinв кладре ЕСТЬ УЛИЦА Александровка (как и улица Достоевского!), которая и вывелась результатом разбора. Противоречивость адреса решена выбором одной из. В КЛАДРе нет УЛИЦЫ Александровка. В КЛАДРе есть ДЕРЕВНЯ Александровка. И проблема как раз в том что в вашем разборе я не вижу столбца "Противоречевость". Обработав таким образом базу в 2-3 десятка тысяч адресов, я не увижу что некоторые из них были обработаны с 95% вероятностью. Не увижу, потому что в результате преобразования получается формально корректный адрес КЛАДР - но неизвестно, совпадает ли он с исходным по факту. А то, что можно принять некоторые допущения и хорошенько подолбавшись, с какой-то вероятностью (чем дольше долбаться, тем выше) разобрать эти адреса - это да, с этим не спорю. И ваш разбор - навскидку - очень неплохо выглядет. Только перечисленные мной проблемы он не решает. bug_scorobey И что вы хотели сказать этим куском КЛАДРа? Что вы его тоже видели? Не сомневаюсь.. Nobody faults but mine... (LZ) О дорогой товарисч не знает что в кладре нет типа дома этажности и т.д. и то что дома то там несколько по другому хранятся (и с целю только индекс проставить) а насчет отображения противоречивости я думаю у уважаемого valerytin'a все это есть как де факто вы не критикуйте лучше а скажите чего бы вам еще хотелось видеть или что очень нужно а мы подумаем и соорудим вам/ пофантазируйте на тему "одной красной кнопки" и вопрос вам как вы думаете сколько труда денег и голого энтузазима нужно что б написать нечто подобное еще раз выражаю признатеьность труду г-на valerytin'a ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:21 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Насчет фантазий технология работы с адресной строкой позволяет перенести эти методики и на роботу с другими видами и типами данных ну что стоит сделать разбор произвольного тескта характеризующего какой либо объект с целью привязки к N-му количеству пересекающихся или нет справочников (классификаторов) а там глядишь и что то осмысленное может получиться :)) ............................................................................. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:28 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
bug_scorobeyесли честно к нам заехал один из участников форума посмотрел очень уважаемый чел если захочет, скажет свое мнение (не важно каким оно будет для меня, но к нему стоит будет прислушаться)Ну не такой уж я и уважаемый, но вчера, дествительно, посмотрел систему. Что можно сказать: 1) В структуре БД ничего сверхъестественного нет - КЛАДР разложенный по таблицам, иерархические справочники, таблицы подстановок - вуобщем ничего выдающегося. 2) Загрузка - из плоской структуры, из 4-х типов данных: DBF, Access, XLS, ODBC. Куда первоначально закачивать поля (как их интерпретировать) - это настраивается. Вобщем, тоже не нано-технологии, но это огрничение не сильно мешает жить (скажу по опыту). 3) Интерфейс - просто интерфейс, без изысков. Ну теперь, собственно, то на что там стоит обратить внимание 4) База основана на КЛАДР, но кроме этого она дополняется за счет обработки результатов почтовых возвратов других организаций. Судя по тому что сегодня прочитал от них же - база пополнялась из разных других источников, которые попадались. 5) Алгоритм - приспособлен к массовой обработке адресов. Как я понял в его оптимизацию вложили много времени. Скорость разбора - впечатляет. 6) Алгоритм ближе не к парсингу (в обычном понимании программистов), а к семантическому анализу строк. Из-за этого порядок сильной роли не играет. 7) Профили разбора адреса - настраиваемые, т.е. существует несколько настроек/алгоритмов - которые позволяют управлять: - скоростью работы (в ущерб отбрасываемым особым случаям) - параметрами используемых ресурсов - включение/выключение особых случаев (например разбор областей с указателями типа региона или без указателей итп.) - включение/выключение поиска по нечетким названиям, опечаткам. т.е. это не "серебрянная пуля" от всего - это инструмент, который позволит выбрать самую эффективную пулю для ваших адресов. 8) Алгоритм разбора работает на сервере (сейчас это MS Sql). Как я понял - обработку можно распаралелить на несколько серверов, если сильно надо. При необходимости - его можно использовать в пакетном режиме. Вкинули адреса, запустили процедурку, получили результат. Запуск разбора адресов - происходит вызовом процедуры, написанной на T-SQL. 9) Кроме адресов - сверки других параметров (названия, ФИО ипр.) - тока в непонятном "опциональном" режиме. Кратко - вот. Вывод я сделал для себя такой. Система интересная, но как и где ее применять - надо еще понять. Нужна тем, кто проводит выверки адресов в массовых количествах. Если нужны не только адреса - то надо смотреть и думать. Рассматривать ее как хранилище адресов - IMHO бессмысленно, разве только как вспомагательное хранилище. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:30 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Спасибо за добрый отклик . Было очень приятно пообщаться. А насчет приложения так наверно ФСБ МВД Налоговая :) шутка :) Для иноземцев делали типа Отто Quelly Shvab и много их приходют к нам скупают кучу адресов и с ними что то надо делать а потом еще ну да ладно понятно ................. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:39 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
> В КЛАДРе нет УЛИЦЫ Александровка. В КЛАДРе есть ДЕРЕВНЯ Александровка. А вот и есть: ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 17:46 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
> сколько труда денег и голого энтузазима нужно что б написать нечто подобное Стоимость такого решения - ноль рублей ноль копеек. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 19:48 |
|
Проверка почтового адреса.
|
|||
---|---|---|---|
#18+
Уважаемый guest_20040621! В виду отсутствия у Вас зарегистрированного профиля, а следовательно возможности обратиться к Вам через e-mail, вынужден здесь попросить у Вас умерить пыл по разведению флеймов, основанных на Вашем само-собой-разумеющемся профессионально превосходстве над всеми прочими участниками форума, благодаря которому все Ваши утверждения априори считаются истиной в последней инстанции, а утверждения оппонентов - неконструктивное трепание языком. Надеюсь, разведение подобных флеймов не является Вашей самоцелью и Вы отнесетесь к этой просьбе с пониманием. С уважением, Александр Гoлдун модератор этого форума в свободное время (которого всегда не хватает) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.09.2007, 20:13 |
|
|
start [/forum/topic.php?fid=33&msg=34785333&tid=1548837]: |
0ms |
get settings: |
9ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
47ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
53ms |
get tp. blocked users: |
1ms |
others: | 13ms |
total: | 150ms |
0 / 0 |