|
|
|
Алгоритм упорядочивания строки
|
|||
|---|---|---|---|
|
#18+
Задача следующая. Имеется Excel в котором имеется информация по контрагенту. Информаци не структурирована, записана в виде строки. Моя задача состоит в том чтобы разбить эту информацию на подстроки. пример: Заказчик: Код: sql 1. 2. 3. примерно в таком виде находится информация, как таковых разделитей нет, Начало подстрок(№ позиции) можно оперделить по ключевым словам...ИНН,ОГРН,Г./с./п/ Область/край, тел./тел/(тел./факс)/ (тел/факс)/ факс; Директор/дир./нач-к/ руководитель . но как мне правилно сделать сортировку этих начальных позиций, чтоб определить что за чем следует... Надеюсь понятно обьяснила суть задачи, возможно сможете направить меня на нужную литературу, тогда буду очень благодарна. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.02.2014, 09:43 |
|
||
|
Алгоритм упорядочивания строки
|
|||
|---|---|---|---|
|
#18+
А что смущает.. берете текст между ключевым словом и следующим ключевым словом. Можете почитать про форму Бэкуса-Наура. Однако никто не застрахован от г. Начальник, директор Иван Иванович Город. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.02.2014, 12:35 |
|
||
|
Алгоритм упорядочивания строки
|
|||
|---|---|---|---|
|
#18+
tasha klemer, это вопрос касательно программирования? Если так, то я бы поступил по такому алгоритму (пример на php): 1. $yourString=str_ireplace(array([все значимые слова, что Вы надиктовали]), "[какой-нить особенный символ типа ; или перевода строки]", $yourString); 2. $arrayOfData = explode("[тот самый особенный символ]", $yourString); 3. preg_match_all("/([тут всё слова, которые были надиктованы, в том же порядке что и в пункте 1, только через | . Не забываем что это регулярка, все значимые символы экранируем])/i", $yourString, $arrayOfKeys); 4. $arrayOfKeys = $arrayOfKeys[0]; 5. В итоге получаем все значения в массиве $arrayOfData, а все ключи в массиве $arrayOfKeys P.S. Не забываем, что просмотр идёт везде по очереди и останавливается на первом совпадении, потому указывать значащие комбинации надо от самой длинной до самой короткой (что бы например вместо "тел." не заменилось "тел", и не осталась лишняя точка... ну и т.д.) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.02.2014, 12:36 |
|
||
|
Алгоритм упорядочивания строки
|
|||
|---|---|---|---|
|
#18+
Подобный алгоритм имеет бесконечный цикл сопровождения. Особенно вам придётся туго с географическими объектами. Они практически не поддаются формализации. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.02.2014, 18:22 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=38548372&tid=1341473]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
167ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
32ms |
get tp. blocked users: |
1ms |
| others: | 239ms |
| total: | 475ms |

| 0 / 0 |
