|
Есть адреса...
|
|||
---|---|---|---|
#18+
Даже не знаю, как решить такую задачу, но возможно кто-то сталкивался с такой задачей на практике есть строка адреса, в которой 6 запятых (это адрес в формате 7 полей, подобно тому, который есть в КЛАДРЕ), причем значения в позициях набраны беспорядочно, например в 1 поле может быть 'Иркутская обл.','Иркутская область' и т.д. Аналогично со второй позицией Нужно привести эту строку к единому виду, например, в соответствие с КЛАДРом. Если не работали с КЛАДРов и не знаете его формат, лучше не отвечайте, посколько хранение кодов и уровней адресов в нем не реляционно, если можно так выразиться ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:01 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Вопрос то у вас какой ? Что вы попробовали сделать и что у вас не получилось ? И причем здесь собственно MSSQL ? ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:08 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Это конечно очень общий вопрос... ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:18 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Если конкретно, то нужно каждой КЛАДР-подобной строке (назовем ее неправильной записью по КЛАДРу) сопоставить код по КЛАДРу ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:20 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98Если конкретно, то нужно каждой КЛАДР-подобной строке (назовем ее неправильной записью по КЛАДРу) сопоставить код по КЛАДРу 1. Что вы попробовали сделать и что у вас не получилось ? 2. И причем здесь собственно MSSQL ? ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:20 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
если это вообще возможно ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:21 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98Если конкретно, то нужно каждой КЛАДР-подобной строке (назовем ее неправильной записью по КЛАДРу) сопоставить код по КЛАДРу Можно (точно делали) Но при чем здесь форум по MS SQL? ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:24 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Я прошу администратора переместить тему в другой раздел, 'разработка информ. систем'. коллегу, который написал, что такую задачу делали, написать мне в приват или в форум. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 10:58 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
мнения остальных участников форума также нинтересны. Прошу высказываться по делу ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 11:43 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98мнения остальных участников форума также нинтересны Если вам мнения участников форума не интересны, наверное не стоит вообще задавать на нем вопросы. Или сначала поработать над логикой, а уже потом писать. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 11:50 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Извините за букву 'н' перед словом 'интересны', это опечатка. А вот логика здесь самое важное. Если бы вопрос был в организации наиболее оптимального поиска подстроки в тексте, я бы обратился к Кнуту. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 11:58 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98есть строка адреса, в которой 6 запятых (это адрес в формате 7 полей, подобно тому, который есть в КЛАДРЕ), причем значения в позициях набраны беспорядочно, например в 1 поле может быть 'Иркутская обл.','Иркутская область' и т.д. Аналогично со второй позицией 1. Примеры строк приведите, пожалуйста. 2. Беспорядочно набраны только значения или позиции тоже перепутаны? Если только значения набраны неверно, то я вижу только вариант нечеткого сравнения. Вычисляете что должно быть в этой позиции и смотрите в КЛАДРе похожие значения. Если значений очень много, подключаете либо человека, либо смотрите уже на совпадение по двум, трем и так далее позициям. Если вам непонятно как это писать - возможно имеет смысл пойти другим путем. Например, воспользоваться существующими программами. Преобразуйте свой массив данных по адресам в формат, который кушает программа контроля реестра обязательств банка перед вкладчиками Агенства страхования вкладов. У них там реализован неплохой аглгоритм сопоставления строки адреса в файле адресу в КЛАДРе. По итогам проверки выдается лог файл, по моему что-то с именем correct, в котором неправильной строке сопоставлена правильная. Это, конечно же костыль, но помочь может. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 12:26 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Если разовая или периодическая проблема - пишите в мыло, могу помочь... ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 16:51 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98мнения остальных участников форума также нинтересны. Прошу высказываться по делуВот процедурка под Oracle, которая в простом варианте дробит адрес. см. сюда. Список замен, которые встречаются в ваших строках, можно добавлять. Раздробленный адрес - соспоставить с КЛАДР-ом - уже гораздо более простая задача. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.01.2008, 17:22 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Примеры адресов ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК/ПОС.6000,,56 КВ-Л,ОБЩ.1,,1 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,95 Б КВ-Л,2,,124 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИКРОРАЙОН,25,,98 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,78 КВ-Л,ОБЩ.22,,16 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,6 МКР,7,,71 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК/МКР.БАЙКАЛЬСК,,ПЕР.1 БЛОЧНЫЙ,6,,1 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,47 КВ,1,,21 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,СТАРО-БАЙКАЛЬСК УЛ.2 МОСКОВСКЯ,18,,не ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,7 МКР,9,,9 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,29 МКР,4,,69 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,33 МКР,9,,96 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,СОЦИАЛИСТИЧЕСКАЯ,1,,7 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,59 КВ-Л,30,,2 ИРКУТСКАЯ ОБЛ.,ПГТ.МЕГЕТ,АНГАРСКИЙ,1 КВАРТАЛ,21,,52 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,М-ОН НОВЫЙ УЛ.САПЕРНАЯ,В/Ч 3695,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,9-Й МРН,26,,29 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,33 М-ОН,10,,49 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ВОРОШИЛОВА 35,ОБЩ 6,,2 а ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,88 КВ-Л,9,,33 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЧАЙКОВСКОГО 52,ОБЩ 16,,120 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,К.МАРКСА,18/9,,17 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,84 КВ-Л,8,,144 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК П.МЕГЕТ,,ЧЕХОВА УЛ.,21,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,А КВАРТАЛ,3,,19 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИКРОРАЙОН,26,,4 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,МР-Н КИТОЙ УЛ.1-КОМСОМОЛЬСКАЯ,14 А,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИКРОРАЙОН,26,,41 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЧАЙКОВСКОГО УЛ.,12,,25 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛ.ЖЕЛЯБОВА,8,,44 ,,,95 КВ.,3,,78 ИРКУТСКАЯ ОБЛ.,,,188 КВАРТАЛ,13,,12 ИРКУТСКАЯ ОБЛ.,,,МР-Н КИТОЙ ПЕР ШКОЛЬНЫЙ,12,,5 ,,,17 МИКРОРАЙОН,11,,130 ,,,,14,,52 ,,,82 КВ.,21,,51 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛИЦА 40 ЛЕТ ОКТЯБРЯ,119,,46 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИКРОРАЙОН,27,,106 ,,,94 КВ.,5,,39 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,6 А МКР,29,,141 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛИЦА ГОРЬКОГО,38,,18 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,92/93 КВ.,14,,7 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,12 А МИКРОРАЙОН,9,,84 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ФАЙЗУЛИНА УЛИЦА,3,,40 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МКР,27,,93 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛ.СОЛИКАМСКАЯ,10,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК МКР СЕВЕРНЫЙ,,НАХИМОВСКАЯ,30,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,32 МИКРОРАЙОН,2,,136 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,МИК-Н 29,15,,18 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,60 КВ-Л,11,,3 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,КРАСНАЯ,10 А,,20 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,33 МКР,11,Е,96 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЛЕНИНГРАДСКИЙ,3 А,,2 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,9 МКР.,23,,25 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,55 КВАРТАЛ,29,,2 ИРКУТСКАЯ ОБЛ.,С.ОДИНСК,,ЛЕНИНА,32,,1 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,72 КВ,9,,53 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,51 КВ-Л,2,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,95 КВАРТАЛ,22,,240 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,МКР.БАЙКАЛЬСК УЛ.КОММУНАЛЬНАЯ,13,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЕНИСЕЙСКАЯ УЛ.,1,А,17 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,9 МКР.,25,,89 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК П.МЕГЕТ,,С.СТЕКЛЯНКА НАБЕРЕЖНАЯ,2,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,18 МИКРОРАЙОН,8,,163 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,94 КВАРТАЛ,12,,15 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ГАГАРИНА,13 А,,24 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛ.КРАСНОФЛОТСКАЯ,25,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,10 МКР,33,,19 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,,47,,105 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,18 МКР,10,,93 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК П.МЕГЕТ,,НЕКРАСОВА,14,,- ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,72 КВ-Л,5,,38 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,8 МКР,6,,19 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,29 МКР,3,,119 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,МКР КИТОЙ,ПАРТИЗАНСКАЯ,48,,147 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИКРОРАЙОН,10,,13 ИРКУТСКАЯ ОБЛ.,ПОС.МЕГЕТ,,33 КВ,15,,16 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,,22,,14 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,84,28,,38 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,13 МКР,26,,54 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,К.МАРКСА 62,ОБЩ 13,,320 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛ.ЛЕНИНА,2 ОБЩ АПК,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,207/210-Й КВ-Л,4,,13 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК МКР КИТОЙ,,1 КОМСОМОЛЬСКАЯ,1,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,23 КВ-Л,1,,8 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,7 МКР,5,,127 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ВОСТОЧНАЯ 40,ОБЩ 8,,35 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,К-МАРКСА 53,ОБЩ 16,, ИРКУТСКАЯ ОБЛ.,ПОС.МЕГЕТ,АНГАРСКИЙ,КАЛИНИНА УЛ.,222,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,29 МИКРОРАЙОН,12,,214 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,9 МИКРОРАЙОН,25,,42 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,СОВЕТСКАЯ УЛ.,1,,3 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,178 КВЛ.,7,,5 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,271 КВ-Л,1,,31 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,НОВОКШЕНОВА УЛ.,7,,48 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,17 А МИКРОРАЙОН,9,АП, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,88 КВЛ,14,,17 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,АНГАРСКИЙ ПРОСП.,18 Б,,115 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЛЕНИНГРАДСКИЙ ПР.,4,,27 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЖЕЛЯБОВА УЛ,7,,18 ,,,6 М-Н,23,,13 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,72 КВАРТАЛ,9,,24 ,ГОР.АНГАРСК,,6 М-Н,11,,101 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,12 А МИКРОРАЙОН,7 А,,58 ,ГОР.АНГАРСК,,,1,,35 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,76 КВ,16,,41 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,95 Б КВ.,3,,22 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,271 КВ.,8,,4 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК МКР.КИТОЙ,,СОВЕТСКАЯ УЛ.,4,,74 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,6 А М-Н,13,,7 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,6 А М-ОН,48,,90 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,18 МИКР,4,,110 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,85 КВЛ,3,,50 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,17 МИКРОРАЙОН,11,,7 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК П.МЕГЕТ,,КАЛИНИНА,30,А, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,УЛ 95 Б КВ-Л,2,,30 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,22 МИКРОРАЙОН,3,,76 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,72 КВ-Л,10,,25 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,84,16,,4 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,84,4,,40 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,29 МИКРОРАЙОН,16,,110 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,К.МАРКСА,45 ОБЩ 2,,1 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ЖАДНОВА,4 ОБЩ 20,,346 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,81 КВ,1,,36 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,МКР.БАЙКАЛЬСК УЛ.КОМИНТРЕНА,40,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,М/Н НОВЫЙ-4,5 А,,4 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,32 МИКРОРАЙОН,4,,204 ИРКУТСКАЯ ОБЛ.,АНГАРСК П.МАЙСК,,ТЕЛЬМАНА,11,,1 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,МРК.СТАРО-БАЙКАЛЬСК УЛ.ВОЛЛОДОГОКСРА,6,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,8 МКР.,101,,49 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,40 ЛЕТ ОКТЯБРЯ,38,,22 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,СОЦИАЛИСТИЧЕСКАЯ,6,,47 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МИК-Н,38,,62 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,14 ДЕКАБРЯ УЛ.,2,,26 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,,3,,115 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,7 МКР,Б,,36 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,АНГАРСКИЙ,95-Й КВ-Л,13,,60 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,94 КВ,4,,30 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК МРН БАЙКАЛЬСК,,ЭНЕРГЕТИКОВ УЛ.,17,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,МКР.КИТОЙ,ГАГАРИНА,39,, ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,92 КВ.,6,,40 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,85 КВАРТАЛ,23,Б,75 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,КОСМОНАВТОВ,5,,110 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ФЕСТИВАЛЬНАЯ УЛ.,21,,33 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,15 МКР,8,,64 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,ПРОСП.ЛЕНИНГРАДСКИЙ,4,,33 ИРКУТСКАЯ ОБЛ.,ГОР.АНГАРСК,,219 КВ-Л,4,,63 Все адреса относятся к одному мун. образованию, это упрощает задачу. Перепутаны не только наименования в позициях, но и сами позиции Кроме того, кое-где формат 6 запятых не соблюдается - из-за использования в наименовании символа ",". ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 04:28 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_98Все адреса относятся к одному мун. образованию, это упрощает задачу. Перепутаны не только наименования в позициях, но и сами позиции Кроме того, кое-где формат 6 запятых не соблюдается - из-за использования в наименовании символа ",".Не так все и плохо... могло быть и хуже. Сделайте следующее: 1) Разберитесь с "хорошими адресам", там где все на месте и где формат полностью соблюдается. 2) Далее из оставшегося - выделите общие случаи (типичные ошибки), которые можно определить и отработать автоматом. 3) Все остальное - на ручную обработку. PS: надеюсь, вы не ждете, что разборщик адресов за вас кто-то напишет? :) ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 11:14 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Конечно нет. Только автоматом определить, что есть "хорошие" адреса не так просто. Нужны дополнительные структуры, хранящие информацию по эталонным адресам, не так ли? ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 11:27 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
P.S. строго говоря, почти все адреса, приведенные выше, неправильные, потому что на самом деле гор. Ангарск - это объект третьего уровня, а не второго. На втором уровне должен стоять 'город Ангарск и район'. Не могу определиться с эталонным ('правильным') справочником ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 11:30 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
У меня следующая идея. Если есть некий эталонный классификатор адресов и он содержит информацию по уровню наименования адресного объекта, то взяв произвольную строку адреса (приведенную выше) можно 1. для каждого из элементов адреса (1-5 уровней, т.е. без домов и квартир) определить его уровень по эталонному классификатору 2. если полученные 5 уровней образуют связанную цепочку (т.е. их можно выстроить в иерархию), то в качестве эталонной строки адреса можно взять адресный объект 5 уровня 3. если для какого-то из объектов нет информации в эталонном классификаторе - ошибка 4. если нельзя построить иерархию адресов - ошибка Но здесь есть проблемы: 1. какой классификатор принять за эталон 2. скорость работы такого алгоритма и его сложность 3. средство разработки - если алгоязык, то как подключить эталонный классификатор, если SQL - то достаточно ли будет языковых средств ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 11:39 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Для начала приведите строки к максимально единообразному виду. Напр., простым replace-м замените все МИКРО, МИКРОРАЙОН к МКР. Избавьтесь от лишних точек после ГОР. и ОБЛ. Далее, необходимо привести к единому виду адресные части, напр. УЛ.ЖЕЛЯБОВА - ЖЕЛЯБОВА УЛ Это можно сделать как либо опять же тупым replace-м, либо выдергивать часть адреса и анализировать ее - конкретное решение зависит от того какие у вас адреса (по всей РФ или только по области) и насколько они кривые. Ну а потом... наступает пора творчества. Описать в размерах поста не могу, тем более сильно зависит от того что на входе. У меня, скажем, наибольшая проблема была с тем, что какая-то часть адреса была пропущена или наоборот лишняя. Nobody faults but mine... (LZ) ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 15:27 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
michael_is_981. для каждого из элементов адреса (1-5 уровней, т.е. без домов и квартир) определить его уровень по эталонному классификатору 2. если полученные 5 уровней образуют связанную цепочку (т.е. их можно выстроить в иерархию), то в качестве эталонной строки адреса можно взять адресный объект 5 уровня Увы... Кабы все было так просто. Деревня Гадюкино может относится к Жопенскому р-ну. А может и к области. А деревень с названием Никитино, напр. в КЛАДРе 74 штуки., в некоторых обл. по несколько штук. Т.е. в этой связанной цепочке может отсутствовать произвольное число звеньев. Что же касается адресной части 5-го уровня ("улица") то там тоже фантазия-то не блещет... Т.е. классическое дерево построить нельзя. Nobody faults but mine... (LZ) ... |
|||
:
Нравится:
Не нравится:
|
|||
28.01.2008, 15:38 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Можно так: Вы мне файл (dbf,excel,текст) с содержимым id+<адрес>, в ответ - аналог вида id+<адрес>+<адрес по кладр>... ... |
|||
:
Нравится:
Не нравится:
|
|||
29.01.2008, 11:03 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
Хорошо, отправлю вам когда соберу все данные. Кроме того, увидел интересные сайты по тематике dataq.ru, например. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.01.2008, 11:58 |
|
Есть адреса...
|
|||
---|---|---|---|
#18+
привет, земеля. поищи аналог http://www.mosclassific.ru/ но для Ангарска. если что, обратись в Атоминформ, это где-то в здании УИСИТ АЭХК в квартале. ------- USA=США, NATO=ОСАС (организация северо-антлантического соглашения) ... |
|||
:
Нравится:
Не нравится:
|
|||
23.05.2008, 10:05 |
|
|
start [/forum/topic.php?fid=33&fpage=44&tid=1548780]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
42ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
2ms |
others: | 11ms |
total: | 151ms |
0 / 0 |