|
|
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
У тебя слабая теоретическая база. Почитай для начала в энциклопедии по Full_text_search . Разберись что такое tokens, keywords, text index, queru language. Изучи возможности текстового поиска в уже готовых решениях (среди них есть даже бесплатные). В противном случае, все твои попытки создать текстовый поиск на базе РСУБД Аксцесс выглядят профанацией. TextSearch "не равно" запросу по таблице. Это мой основной тезис. Всё. Успехов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 12:36:51 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnot "Написать приложение, позволяющее заводить в программу данные, содержащие текст. Данные должны храниться в базе данных. Программа должна позволять просматривать документы и осуществлять поиск выбранного слова или словосочетания в других документах, сортируя результат по релевантности. Имеется в виду, что сочетание «мама мыла раму» будет соответствовать искомой строке «мама мыла», а так же строке «мама раму», но уже с меньшим коэффициентом релевантности " Как это понимать? Что здесь подразумевается под данными, под текстом? Как они должны быть структурированы? Ну и пр и пр... чего тут понимать? если речь о похожести/совпадении словосочетаний - это fulltextsearch. читай тут . что характерно уже все готовое. задача реализуема за пару часов после прочтения. на пятерку с плюсом можно еще пользовательский ispell-словарь добавить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 13:16:28 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
хорошо) почитаем) ну что делать.... раз теоретическая база такая... не каждую неделю приходится писать поисковики... Тем более, если круглый год только веб-версткой занимаешься... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 18:32:37 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytonУ тебя слабая теоретическая база. Почитай для начала в энциклопедии по Full_text_search . Разберись что такое tokens, keywords, text index, queru language. Изучи возможности текстового поиска в уже готовых решениях (среди них есть даже бесплатные). В противном случае, все твои попытки создать текстовый поиск на базе РСУБД Аксцесс выглядят профанацией. TextSearch "не равно" запросу по таблице. Это мой основной тезис. Всё. Успехов. Конечно немного стыдно, но можно объяснить своими словами, что такое fulltext-поиск? Знаю, что есть в SQL такие операторы, но как это все работает... Тем более, что Вы говорите, что работы там на два часа...А то голова кругом идет уже от разных реализаций этого поиска, терминологии.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 19:14:21 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnot Конечно немного стыдно, но можно объяснить своими словами, что такое fulltext-поиск? Знаю, что есть в SQL такие операторы, но как это все работает... почитай ту ссылку что я дал. коротко говорят, он работает как раз так, как тебе надо ;) gnot Тем более, что Вы говорите, что работы там на два часа... это я говорил. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 19:53:27 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
ну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 21:10:23 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnotну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело... Думаю, что на русском - есть. Вообще это тебе тема для самостоятельного изучения. Вряд-ли кто-то разжуёт тебе текстовый поиск, особенно в условиях твоей сложной постановки. Читай, думай. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 21:28:23 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytongnotну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело... Думаю, что на русском - есть. Вообще это тебе тема для самостоятельного изучения. Вряд-ли кто-то разжуёт тебе текстовый поиск, особенно в условиях твоей сложной постановки. Читай, думай. Издеваетесь) для меня то конечно сложная) Это для вас -раз плюнуть) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 21:36:26 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
ну все таки... Что в моем случае-то надо? Во-первых, откуда брать данные? Из таблиц БД или из текстовых документов, которые хранятся в БД? Тут пытаюсь понять, ЧТО собственно нам надо загрузить в программу и ОТКУДА... Потом, SQL я более-менее знаю, что такое Index и пр. Но вот команду FULLTEXT не понимаю... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 21:55:01 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Почитай как это делается в Оракле. http://www.oracle.com/technology/pub/articles/asplund-textsearch.html В PostgreSQL: http://www.postgresql.org/docs/8.3/static/textsearch.html В MySQL: http://devzone.zend.com/article/1304 В прикладной библиотеке Lucene: http://lucene.apache.org/java/3_0_0/api/demo/index.html ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.02.2010, 22:47:14 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
почитаю) ок) Только это тк сказать, инструменты... Мне надо определиться, ГДЕ искать... Как я понял из постановки задачи понял, что надо тянуть из некой БД некие данные. Не сказано так же, как их отобразить, в каком виде.. Так же абсолютно ничего не сказано о том, какая там структура. Вот и предположил выше гипотезу о том, что есть некая таблица: id Description 1.01 мама мыла раму 2.01 мама мыла пол Может не прав, но появляется аналогия такая: Прежде чем построить дом, нужно его сначала четко представлять, каким он будет, сколько этажей, в каком стиле и пр.. И потом решать, какую марку цемента выбрать, какие применять инструменты для строительства... А если дать архитектору задание типа "построй двух-этажный дом с окнами, но чтобы были самые профессиональные строители, самая лучшая марка цемента, самая лучшая облицовка". Архитектор, конечно же, задаст кучу вопросов про то, сколько должно быть окон, в каком стиле нужно строить, какие размеры должны быть и пр.... А если на это заказчик ответит что-то типа - "вы же архитектор! Вы это должны знать!". То что тогда? Вот так и я подхожу к разработке... Не знаю, может я и не прав... Но заведи в программу "что-то", "откуда-то", отсортируй "как-то"... С последним еще понятно, а вот с остальным... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 13:46:43 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnot, А может вам уже готовый внешний движок прикрутить? Персональный поиск Яндекса , Яндекс.Сервер или Google Desktop. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 13:55:23 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
да можно что угодно прикрутить... Вы лучше пока помогите определиться, ОТКУДА мы должны брать данные и в каком виде загружать в программу? Как я понял, что мы тянем их из БД. Причем не сказано ничего ни про структуру, ни про организацию, ни про то, какие данные там хранятся. Поэтому имею право предложить свой вариант (id, description). Далее. Описание загружаю в простой текстовый формат. В текстовый редактор или что-то наподобие. И в нем уже могу делать поиск, редактировать. Я правильно сформулировал? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 14:07:46 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Я пока даже не понял, вам нужен поиск текстов среди их множества или поиск определенных фраз/слов в одном тексте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 14:14:15 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
gnot, ты очень странный разработчик. Ты спрашиваешь ОТКУДА брать? Ну ясен пень, тебе должны дать тестовые данные. Это обсуждается с заказчиком. Или ты должен сам ПРИДУМАТЬ тестовые данные, но предупредить заказчика что это будет нерепрезентативно. Далее. Ты спрашиваешь в КАКОМ виде загружать. Отвечаю. Если тебе ДАНЫ исходные данные в ТЕКСТОВОМ формате то их всегда можно загрузить в любую СУБД. Если ты УЖЕ определился с тем КАКУЮ СУБД ты берёш - кури примеры которые я указал. В одной из них текстовые данные грузятся в BLOB-поля, в текстовые поля и т.д. И самое важное. Ты должен уметь КОНВЕРТИРОВАТЬ данные из текста в бинарь и обратно, из byte-ANSI,Win1251,cp855.... в unicode и ОБРАТНО, фильтровать средствами СУБД/языка разработки. Но эти вопросы в теме даже не обсуждаются!!! Предполагается что ты это УЖЕ умеешь делать! Если тебе УЖЕ ДАНЫ данные в БИНАРНОМ формате, ты должен обсужить с заказчиком как с ними работать (драйвер-библиотека), как ИНТЕРПРЕТИРОВАТЬ бинарные поля и т.д. Понял? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 14:23:52 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytongnot, ты очень странный разработчик. Ты спрашиваешь ОТКУДА брать? Ну ясен пень, тебе должны дать тестовые данные. Это обсуждается с заказчиком. Или ты должен сам ПРИДУМАТЬ тестовые данные, но предупредить заказчика что это будет нерепрезентативно. Далее. Ты спрашиваешь в КАКОМ виде загружать. Отвечаю. Если тебе ДАНЫ исходные данные в ТЕКСТОВОМ формате то их всегда можно загрузить в любую СУБД. Если ты УЖЕ определился с тем КАКУЮ СУБД ты берёш - кури примеры которые я указал. В одной из них текстовые данные грузятся в BLOB-поля, в текстовые поля и т.д. Понял? Понял. Но не понял, какие именно будут ТЕКСТОВЫЕ ДАННЫЕ. Как они должны быть стурктурированны? Что подразумевается под текстовыми данными? Если нужно загрузить в программу сборник сочинений Пушкина - это одно. Если короткий текст типа описание - то совсем другое... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 15:21:37 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
А у тебя что? Текст Пушкина? Или камент? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 15:35:56 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
В том то и дело, что об этом ничего не сказано) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 15:38:54 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Тогда зачем ты себе сушишь голову тем, чего не можешь знать? Делай общую постановку. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 16:04:21 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytonТогда зачем ты себе сушишь голову тем, чего не можешь знать? Делай общую постановку. Это как? Вот выдержка их вики: " Полноте́кстовый по́иск — поиск документа в базе данных текстов на основании содержимого этих документов, а также совокупность методов оптимизации этого процесса. " Вот, что здесь подразумевается под документами? Что это за документы? Любые документы, в том числе в формате MsWord? Сорри конечно, может быть, достаточно глупые вопросы задаю... Но с БД работаю лишь на уровне запросов в таблицы, объекты, где информация структурирована. Ну то есть различные запросы к полям таблиц, модификацию, создание и пр) У нас Документум - там вообще запросы на уровне объектов) Ну конечно, документы типа Word(да и вообще любые) тоже есть в контенте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 16:25:54 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Я наверное тебя сильно удивлю, но индексирование документов MS-Word принципиально ничем не отличается от индексирования text/plan файлов. Разница в том, что Word-документы проходят фильтрацию. Из них полностью "выметается" дизайн и форматирование. Остаётся плоский текст. Правда здесь можно усложнить индексирование, если зацепитьзя за мета-теги, которые содержит документ. Это опционально и зависит от твоей задачи. Будешь-ли ты искать по мета-тегам или по контенту. Т.е. обобщая индексирование текстов и доков: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. Фильтрация MS-Word документов - это отдельная тема. Мы её рассматривать не будем. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 16:37:49 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
ну ладно) А поиск надо сделать по названию файла, или по содержимому файла? Может конечно туплю, но совсем запутался... Кучу сылок читаю сейчас про полнотекстовый поиск в оракл и пр... Чувствую, еще больше не понял, что же все таки надо искать... По атрибутам документа или в содержаниии.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 17:06:54 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
Это твоя постановка. Как хочешь - так и делай. Но если цель найти имя файла то имена тоже надо добавлять в базу дополнительным атрибутом. Но главный поиск должен идти по content-у. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 17:45:20 |
|
||
|
Релевантность
|
|||
|---|---|---|---|
|
#18+
maytonЭто твоя постановка. Как хочешь - так и делай. Но если цель найти имя файла то имена тоже надо добавлять в базу дополнительным атрибутом. Но главный поиск должен идти по content-у. По контенту уже открытого файла?) То есть, нашли мы его в БД, открыли в текстовом нашем редакторе и там ищем слова, словосочетания?) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.02.2010, 17:47:27 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=36486323&tid=1343863]: |
0ms |
get settings: |
10ms |
get forum list: |
20ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
210ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
65ms |
get tp. blocked users: |
1ms |
| others: | 237ms |
| total: | 566ms |

| 0 / 0 |
