powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск по-базе статей
18 сообщений из 18, страница 1 из 1
Поиск по-базе статей
    #39621138
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нужно создать базу статей в разных форматах. TXT, RTF, DOC, HTML и т.д.
Как организовать поиск по словам из статей?
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621147
Фотография Akina
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Использовать внешний поисковый механизм, умеющий индексировать файлы указанных форматов.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621151
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Akina,

Никакого внешнего механизма нет.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621161
Фотография Нахлобуч
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А что есть?
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621187
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltКак организовать поиск по словам из статей?
Привести данные из всех форматов в один, наиболее удобный для поиска. Обычно это TXT. Далее задача сводится к уже решенной.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621204
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нахлобуч,

Только статьи в БД, в различных форматах
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621208
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovEoltКак организовать поиск по словам из статей?
Привести данные из всех форматов в один, наиболее удобный для поиска. Обычно это TXT. Далее задача сводится к уже решенной.

Тоже думал об этом, но получается дублирование информации.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621248
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltDimitry Sibiryakovпропущено...

Привести данные из всех форматов в один, наиболее удобный для поиска. Обычно это TXT. Далее задача сводится к уже решенной.

Тоже думал об этом, но получается дублирование информации.

Перед загрузкой статьи в БД - сконвертировать ее в TXT. А потом уже искать.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621718
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltНужно создать базу статей в разных форматах. TXT, RTF, DOC, HTML и т.д.
Как организовать поиск по словам из статей?
Ты хочешь программировать или тебе нужно готовое решение.?
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621762
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltНикакого внешнего механизма нет.Разверните, например, Solr - надстройка Lucene для работы с разными форматами.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621832
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
maytonEoltНужно создать базу статей в разных форматах. TXT, RTF, DOC, HTML и т.д.
Как организовать поиск по словам из статей?
Ты хочешь программировать или тебе нужно готовое решение.?

Нужно запрограммировать. Написать приложенице с поиском по-словам в статьях.
База файловая, например SQLite, лежащая в сетевой папке. Клиент к БД виндовый, написан на C# или VB.

Это хранилище статей. Пользователь может загрузить в базу статью в любом формате, например RTF.
А потом найти ее, по-какому нибудь слову которое есть в этой статье. После этого он может скачать статью к себе, в RTF формате.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621849
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltНужно запрограммировать. ... Клиент к БД виндовый, написан на C# или VB. Sphinx Search Engine .
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621874
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. SidorovEoltНужно запрограммировать. ... Клиент к БД виндовый, написан на C# или VB. Sphinx Search Engine .

Нет, явно не то, что нужно.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621878
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltНет, явно не то, что нужно.Исходники - есть, виндовые бинари - есть, работа с MySQL/PostgreSQL - тоже есть.
Может и SQLite кто окучил - я просто не искал.

P.S. "Нет, вы посмотрите на этого поца - всю Одессу удовлетворяет, а его, видите-ли - нет!".
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621924
Eolt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov,

Там сервер, а значит уже нет. Мне нужно виндовое приложение клиент + файл базы данных sqlite.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39621992
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltТам сервер, а значит уже нет
как бы вам помягче сказать ... embedded sphinx
JNI start JVM
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39622030
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltТоже думал об этом, но получается дублирование информации.
В данном случае это не проблема.
...
Рейтинг: 0 / 0
Поиск по-базе статей
    #39622959
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
EoltBasil A. Sidorov,

Там сервер, а значит уже нет. Мне нужно виндовое приложение клиент + файл базы данных sqlite.
Мне понадобилось несколько секунд чтобы найти следущее.
https://www.sqlite.org/fts3.html#full_text_index_queries

Я думаю что это на 80% уже решенная задача. Тебе осталось только создать
табличку и наполнить еще очищенными текстовыми данными на основе статей.

Как превратить RTF/DOC/HTML в текст - спроси отдельным топиком.
...
Рейтинг: 0 / 0
18 сообщений из 18, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск по-базе статей
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]