|
|
|
Обьединение строк - вопрос скорее алгоритмический.
|
|||
|---|---|---|---|
|
#18+
Есть некая строка. Допустим, "Взволнованная Маша столовой ложкой ела кашу". В ней есть слова, которые можно менять. Например, [кашу]. "Взволнованная Маша столовой ложкой ела винигрет/суп" и т.п. Есть вторая строка: "Оригинальная Валерия столовой ложкой ела колбасу", где "колбасу" так же изменяемое слово. "Оригинальная Валерия столовой ложкой ела хлеб/помидор". И таких, по большому счету сходных предложений у меня в базе может быть тысяч 10 - немного. Изменяемые слова в предложении могут находиться в любом месте, их может быть произвольное число. вопрос. Хранить данные я могу, вариант а - по словам, тогда каждому слову дается id, предложение лежит как: id, id_word 1, 1 1, 2 1, 3 и потом я эти слова процедурой обьединяю. Либо я могу хранить собственно куски предложений, вариант б: "столовой ложкой ела" и уже их хранить и обьединять. Очевидно, что в случае с кусками предложений - я выигрываю на скорости обьединения. Не менее очевидно, что я проигрываю в обьеме базы и храню лишнюю, дублирующуюся информацию, плюс в предложение может всраться ошибка. В случае хранения слов - я теряю в скорости обьединения и усложняю алгоритм сборки, но выигрываю в обьеме, не храню лишние данные, предложение, собранное из выверенных слов, всегда одинаковое. Что разумней выбрать? Могу построить любые индекс для скорости выборки. Запись в базу практически не ведется, только выборка, и даже она - не в промышленных масштабах, если будет тысяч 10 запросов к базе в час, то уже круто. Склоняюсь к варианту а, хранению слов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 13:01:17 |
|
||
|
|

start [/forum/topic.php?fid=47&msg=38642140&tid=1834830]: |
0ms |
get settings: |
7ms |
get forum list: |
14ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
35ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
44ms |
get tp. blocked users: |
2ms |
| others: | 236ms |
| total: | 360ms |

| 0 / 0 |
