powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность
25 сообщений из 60, страница 2 из 3
Релевантность
    #36484165
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У тебя слабая теоретическая база. Почитай для начала
в энциклопедии по Full_text_search . Разберись что
такое tokens, keywords, text index, queru language.
Изучи возможности текстового поиска в уже готовых
решениях (среди них есть даже бесплатные).

В противном случае, все твои попытки создать текстовый поиск
на базе РСУБД Аксцесс выглядят профанацией.

TextSearch "не равно" запросу по таблице. Это мой основной тезис.

Всё. Успехов.
...
Рейтинг: 0 / 0
Релевантность
    #36484231
chpasha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnot
"Написать приложение, позволяющее заводить в программу данные, содержащие текст.
Данные должны храниться в базе данных.

Программа должна позволять просматривать документы и осуществлять поиск выбранного слова или словосочетания в других документах, сортируя результат по релевантности. Имеется в виду, что сочетание «мама мыла раму» будет соответствовать искомой строке «мама мыла», а так же строке «мама раму», но уже с меньшим коэффициентом релевантности
"
Как это понимать? Что здесь подразумевается под данными, под текстом? Как они должны быть структурированы? Ну и пр и пр...
чего тут понимать? если речь о похожести/совпадении словосочетаний - это fulltextsearch.
читай тут . что характерно уже все готовое. задача реализуема за пару часов после прочтения. на пятерку с плюсом можно еще пользовательский ispell-словарь добавить.
...
Рейтинг: 0 / 0
Релевантность
    #36484688
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
хорошо) почитаем) ну что делать.... раз теоретическая база такая... не каждую неделю приходится писать поисковики... Тем более, если круглый год только веб-версткой занимаешься...
...
Рейтинг: 0 / 0
Релевантность
    #36484748
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonУ тебя слабая теоретическая база. Почитай для начала
в энциклопедии по Full_text_search . Разберись что
такое tokens, keywords, text index, queru language.
Изучи возможности текстового поиска в уже готовых
решениях (среди них есть даже бесплатные).

В противном случае, все твои попытки создать текстовый поиск
на базе РСУБД Аксцесс выглядят профанацией.

TextSearch "не равно" запросу по таблице. Это мой основной тезис.

Всё. Успехов.

Конечно немного стыдно, но можно объяснить своими словами, что такое fulltext-поиск? Знаю, что есть в SQL такие операторы, но как это все работает... Тем более, что Вы говорите, что работы там на два часа...А то голова кругом идет уже от разных реализаций этого поиска, терминологии..
...
Рейтинг: 0 / 0
Релевантность
    #36484816
chpasha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnot
Конечно немного стыдно, но можно объяснить своими словами, что такое fulltext-поиск? Знаю, что есть в SQL такие операторы, но как это все работает...
почитай ту ссылку что я дал. коротко говорят, он работает как раз так, как тебе надо ;)

gnot
Тем более, что Вы говорите, что работы там на два часа...
это я говорил.
...
Рейтинг: 0 / 0
Релевантность
    #36484866
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело...
...
Рейтинг: 0 / 0
Релевантность
    #36484875
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnotну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело...
Думаю, что на русском - есть. Вообще это тебе тема для самостоятельного изучения. Вряд-ли кто-то разжуёт тебе текстовый поиск, особенно в условиях твоей сложной постановки. Читай, думай.
...
Рейтинг: 0 / 0
Релевантность
    #36484885
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytongnotну а на русском инфы, как понял нет) английским не очень владею) всеюжизнь дойч учил) только со словарем, но он так переводит весело...
Думаю, что на русском - есть. Вообще это тебе тема для самостоятельного изучения. Вряд-ли кто-то разжуёт тебе текстовый поиск, особенно в условиях твоей сложной постановки. Читай, думай.

Издеваетесь) для меня то конечно сложная) Это для вас -раз плюнуть)
...
Рейтинг: 0 / 0
Релевантность
    #36484891
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Не ленись.
...
Рейтинг: 0 / 0
Релевантность
    #36484900
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ну все таки... Что в моем случае-то надо?
Во-первых, откуда брать данные? Из таблиц БД или из текстовых документов, которые хранятся в БД?
Тут пытаюсь понять, ЧТО собственно нам надо загрузить в программу и ОТКУДА...
Потом, SQL я более-менее знаю, что такое Index и пр. Но вот команду FULLTEXT не понимаю...
...
Рейтинг: 0 / 0
Релевантность
    #36484930
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Почитай как это делается в Оракле.

http://www.oracle.com/technology/pub/articles/asplund-textsearch.html

В PostgreSQL:

http://www.postgresql.org/docs/8.3/static/textsearch.html

В MySQL:

http://devzone.zend.com/article/1304

В прикладной библиотеке Lucene:

http://lucene.apache.org/java/3_0_0/api/demo/index.html
...
Рейтинг: 0 / 0
Релевантность
    #36485776
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
почитаю) ок) Только это тк сказать, инструменты... Мне надо определиться, ГДЕ искать... Как я понял из постановки задачи понял, что надо тянуть из некой БД некие данные. Не сказано так же, как их отобразить, в каком виде.. Так же абсолютно ничего не сказано о том, какая там структура. Вот и предположил выше гипотезу о том, что есть некая таблица:

id Description
1.01 мама мыла раму
2.01 мама мыла пол

Может не прав, но появляется аналогия такая:
Прежде чем построить дом, нужно его сначала четко представлять, каким он будет, сколько этажей, в каком стиле и пр.. И потом решать, какую марку цемента выбрать, какие применять инструменты для строительства...
А если дать архитектору задание типа "построй двух-этажный дом с окнами, но чтобы были самые профессиональные строители, самая лучшая марка цемента, самая лучшая облицовка". Архитектор, конечно же, задаст кучу вопросов про то, сколько должно быть окон, в каком стиле нужно строить, какие размеры должны быть и пр.... А если на это заказчик ответит что-то типа - "вы же архитектор! Вы это должны знать!".
То что тогда?
Вот так и я подхожу к разработке... Не знаю, может я и не прав... Но заведи в программу "что-то", "откуда-то", отсортируй "как-то"... С последним еще понятно, а вот с остальным...
...
Рейтинг: 0 / 0
Релевантность
    #36485798
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnot,

А может вам уже готовый внешний движок прикрутить?
Персональный поиск Яндекса , Яндекс.Сервер или Google Desktop.
...
Рейтинг: 0 / 0
Релевантность
    #36485823
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
да можно что угодно прикрутить... Вы лучше пока помогите определиться, ОТКУДА мы должны брать данные и в каком виде загружать в программу? Как я понял, что мы тянем их из БД. Причем не сказано ничего ни про структуру, ни про организацию, ни про то, какие данные там хранятся. Поэтому имею право предложить свой вариант (id, description). Далее. Описание загружаю в простой текстовый формат. В текстовый редактор или что-то наподобие. И в нем уже могу делать поиск, редактировать.
Я правильно сформулировал?
...
Рейтинг: 0 / 0
Релевантность
    #36485838
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я пока даже не понял, вам нужен поиск текстов среди их множества или поиск определенных фраз/слов в одном тексте.
...
Рейтинг: 0 / 0
Релевантность
    #36485869
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gnot,

ты очень странный разработчик. Ты спрашиваешь ОТКУДА брать? Ну ясен пень, тебе должны дать тестовые данные. Это обсуждается с заказчиком. Или ты должен сам ПРИДУМАТЬ тестовые данные, но предупредить заказчика что это будет нерепрезентативно. Далее. Ты спрашиваешь в КАКОМ виде загружать. Отвечаю. Если тебе ДАНЫ исходные данные в ТЕКСТОВОМ формате то их всегда можно загрузить в любую СУБД. Если ты УЖЕ определился с тем КАКУЮ СУБД ты берёш - кури примеры которые я указал. В одной из них текстовые данные грузятся в BLOB-поля, в текстовые поля и т.д. И самое важное. Ты должен уметь КОНВЕРТИРОВАТЬ данные из текста в бинарь и обратно, из byte-ANSI,Win1251,cp855.... в unicode и ОБРАТНО, фильтровать средствами СУБД/языка разработки. Но эти вопросы в теме даже не обсуждаются!!! Предполагается что ты это УЖЕ умеешь делать! Если тебе УЖЕ ДАНЫ данные в БИНАРНОМ формате, ты должен обсужить с заказчиком как с ними работать (драйвер-библиотека), как ИНТЕРПРЕТИРОВАТЬ бинарные поля и т.д.

Понял?
...
Рейтинг: 0 / 0
Релевантность
    #36486000
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytongnot,

ты очень странный разработчик. Ты спрашиваешь ОТКУДА брать? Ну ясен пень, тебе должны дать тестовые данные. Это обсуждается с заказчиком. Или ты должен сам ПРИДУМАТЬ тестовые данные, но предупредить заказчика что это будет нерепрезентативно. Далее. Ты спрашиваешь в КАКОМ виде загружать. Отвечаю. Если тебе ДАНЫ исходные данные в ТЕКСТОВОМ формате то их всегда можно загрузить в любую СУБД. Если ты УЖЕ определился с тем КАКУЮ СУБД ты берёш - кури примеры которые я указал. В одной из них текстовые данные грузятся в BLOB-поля, в текстовые поля и т.д.

Понял?
Понял. Но не понял, какие именно будут ТЕКСТОВЫЕ ДАННЫЕ. Как они должны быть стурктурированны?
Что подразумевается под текстовыми данными? Если нужно загрузить в программу сборник сочинений Пушкина - это одно. Если короткий текст типа описание - то совсем другое...
...
Рейтинг: 0 / 0
Релевантность
    #36486055
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А у тебя что? Текст Пушкина? Или камент?
...
Рейтинг: 0 / 0
Релевантность
    #36486065
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
В том то и дело, что об этом ничего не сказано)
...
Рейтинг: 0 / 0
Релевантность
    #36486129
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тогда зачем ты себе сушишь голову тем, чего не можешь знать? Делай общую постановку.
...
Рейтинг: 0 / 0
Релевантность
    #36486202
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonТогда зачем ты себе сушишь голову тем, чего не можешь знать? Делай общую постановку.
Это как?
Вот выдержка их вики:

"
Полноте́кстовый по́иск — поиск документа в базе данных текстов на основании содержимого этих документов, а также совокупность методов оптимизации этого процесса.
"
Вот, что здесь подразумевается под документами?
Что это за документы? Любые документы, в том числе в формате MsWord? Сорри конечно, может быть, достаточно глупые вопросы задаю... Но с БД работаю лишь на уровне запросов в таблицы, объекты, где информация структурирована.
Ну то есть различные запросы к полям таблиц, модификацию, создание и пр)
У нас Документум - там вообще запросы на уровне объектов) Ну конечно, документы типа Word(да и вообще любые) тоже есть в контенте.
...
Рейтинг: 0 / 0
Релевантность
    #36486229
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я наверное тебя сильно удивлю, но индексирование документов MS-Word принципиально ничем не отличается от индексирования text/plan файлов. Разница в том, что Word-документы проходят фильтрацию. Из них полностью "выметается" дизайн и форматирование. Остаётся плоский текст. Правда здесь можно усложнить индексирование, если зацепитьзя за мета-теги, которые содержит документ. Это опционально и зависит от твоей задачи. Будешь-ли ты искать по мета-тегам или по контенту.

Т.е. обобщая индексирование текстов и доков:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
Текстовый файл
 +- Имя файла (атрибут)
 +- Размер (атрибут)
 +- Дата создания (атрибут)
 +- Контент (индекс)

Документ MS-Word.
 +- Имя файла (атрибут)
 +- Размер (атрибут)
 +- Дата создания (атрибут) 
 +- Мета-теги
       + Название (атрибут)
       + Тема (атрибут)
       + Автор (атрибут)
       + .... прочие
 +- Контент (индекс)

Фильтрация MS-Word документов - это отдельная тема. Мы её рассматривать не будем.
...
Рейтинг: 0 / 0
Релевантность
    #36486323
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ну ладно) А поиск надо сделать по названию файла, или по содержимому файла? Может конечно туплю, но совсем запутался... Кучу сылок читаю сейчас про полнотекстовый поиск в оракл и пр...
Чувствую, еще больше не понял, что же все таки надо искать... По атрибутам документа или в содержаниии....
...
Рейтинг: 0 / 0
Релевантность
    #36486445
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Это твоя постановка. Как хочешь - так и делай. Но если цель найти имя файла то имена тоже надо добавлять в базу дополнительным атрибутом. Но главный поиск должен идти по content-у.
...
Рейтинг: 0 / 0
Релевантность
    #36486451
gnot
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonЭто твоя постановка. Как хочешь - так и делай. Но если цель найти имя файла то имена тоже надо добавлять в базу дополнительным атрибутом. Но главный поиск должен идти по content-у.
По контенту уже открытого файла?) То есть, нашли мы его в БД, открыли в текстовом нашем редакторе и там ищем слова, словосочетания?)
...
Рейтинг: 0 / 0
25 сообщений из 60, страница 2 из 3
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Релевантность
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]