Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Структура БД слов и фраз / 15 сообщений из 15, страница 1 из 1
06.08.2005, 21:15
    #33205438
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Помогите спроектироавть БД ключевых слов. БД будет в MySQL. Вообщем суть такая... Берем слово "wig" с таким словом народ ищет в поискових скажем 10 и более фраз "elvis wig", "raquel welch wig", "wig sale", "man wig" и др. Потом к нему есть еще похожее слово "wigs". Есть еще список дополнительных слов слов к "wig": "hairpieces","hairstyle","halloween costumes","beautytrends" и т.д. И есть еще список синонимов "wigging" и т.д.
Вообщем как все граммотно в таблицы раскидать?
...
Рейтинг: 0 / 0
06.08.2005, 22:56
    #33205473
Andres 1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
А зависит от того, что нужно. Например, для перевода структура будет одна, а для поиска - другая.
Что-то такое?
...
Рейтинг: 0 / 0
06.08.2005, 23:04
    #33205476
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Слова для поиска. Т.е. будет выборка. Ввожу "wig" получаю все что к этому слову относится. Но если все держать в одной таблице то записей будет 50-100 миллионов. Вот я и думаю что надо наверно как то оптимизировать БД.
P.S. А картиночку можно расшифровать немного. Я спец софт по проектированию не юзаю. И мне к сожалению многое на картинке не ясно...
...
Рейтинг: 0 / 0
07.08.2005, 12:12
    #33205503
Andres 1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyPro...
P.S. А картиночку можно расшифровать немного. Я спец софт по проектированию не юзаю. И мне к сожалению многое на картинке не ясно...
Document - документы, книги, web-страницы - короче, тексты.
DocumentWord - слова документа (№ п.п. - поле seq)
Word - слова
Relation - отношения слов (синоним, антоним и т.д. и т.п.)
WordRelation - собственно отношения слов.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
create table Document
(
   TextId                         int                            not null AUTO_INCREMENT,
   Caption                        varchar( 255 )                   not null,
   primary key (TextId)
);
create table DocumentWord
(
   TextId                         int                            not null,
   WordId                         int                            not null,
   Seq                            bigint                         not null,
   primary key (TextId, WordId, Seq)
);
create index Text_Words_FK on DocumentWord
(
   TextId
);
create index DocWords_FK on DocumentWord
(
   WordId
);

create table Relation
(
   RelationId                     int                            not null AUTO_INCREMENT,
   Name                           varchar( 255 )                   not null,
   primary key (RelationId)
);
create table Word
(
   WordId                         int                            not null AUTO_INCREMENT,
   Word                           varchar( 255 )                   not null,
   primary key (WordId)
);
create table WordRelation
(
   RelationId                     int                            not null,
   Word1Id                        int                            not null,
   Word2Id                        int                            not null,
   primary key (RelationId, Word1Id, Word2Id)
);
create index Relationship_Type_FK on WordRelation
(
   RelationId
);
create index Word1_FK on WordRelation
(
   Word1Id
);
create index Word2_FK on WordRelation
(
   Word2Id
);

alter table DocumentWord add constraint FK_DocWords foreign key (WordId)
      references Word (WordId);

alter table DocumentWord add constraint FK_Text_Words foreign key (TextId)
      references Document (TextId);

alter table WordRelation add constraint FK_Relationship_Type foreign key (RelationId)
      references Relation (RelationId);

alter table WordRelation add constraint FK_Word1 foreign key (Word1Id)
      references Word (WordId);

alter table WordRelation add constraint FK_Word2 foreign key (Word2Id)
      references Word (WordId);
...
Рейтинг: 0 / 0
07.08.2005, 13:48
    #33205528
Di_LIne
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyProСлова для поиска.... Но если все держать в одной таблице то записей будет 50-100 миллионов. Вот я и думаю что надо наверно как то оптимизировать БД.
А помятие "морфология" ни о чем не говорит?
Покопай в эту стороны...
Правда... Если силенок хватит...
Не ты первый, и не ты последний - за такое хватаются...
имхо - это можно только "командой" челов 10-15 вытянуть...
...
Рейтинг: 0 / 0
07.08.2005, 13:56
    #33205532
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Di_LIneА помятие "морфология" ни о чем не говорит?
Покопай в эту стороны...
Правда... Если силенок хватит...
Не ты первый, и не ты последний - за такое хватаются...
имхо - это можно только "командой" челов 10-15 вытянуть...
Говорит. Но я не собираюсь поисковик делать. Мне это нужно для удобства работы. Подбирать слова. Сами списки слов я стяну с поисковиков, но мне надо это хранить в удобной для меня форме. :)
...
Рейтинг: 0 / 0
07.08.2005, 14:02
    #33205536
Di_LIne
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyPro Di_LIneА помятие "морфология" ни о чем не говорит?
Покопай в эту стороны...
Правда... Если силенок хватит...
Не ты первый, и не ты последний - за такое хватаются...
имхо - это можно только "командой" челов 10-15 вытянуть...
Говорит. Но я не собираюсь поисковик делать. Мне это нужно для удобства работы. Подбирать слова. Сами списки слов я стяну с поисковиков, но мне надо это хранить в удобной для меня форме. :)
А чем плох ispell???
Возьми его за основу...
Во!
AlexeyPro
Relation - отношения слов (синоним, антоним и т.д. и т.п.)
Найдешь - подкинь, плизззз, такой словарик...
...
Рейтинг: 0 / 0
07.08.2005, 14:11
    #33205541
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Di_LIne А чем плох ispell???
Возьми его за основу...
Шо за зверь такой?
Di_LIne
Relation - отношения слов (синоним, антоним и т.д. и т.п.)
Найдешь - подкинь, плизззз, такой словарик...
В Word 2003 есть. А так в инете полно. В яндекс лингве точно есть.
...
Рейтинг: 0 / 0
07.08.2005, 14:17
    #33205545
Di_LIne
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyPro Di_LIne А чем плох ispell???
Возьми его за основу...
Шо за зверь такой?
Копани Яндекс...
AlexeyPro Di_LIne
Relation - отношения слов (синоним, антоним и т.д. и т.п.)
Найдешь - подкинь, плизззз, такой словарик...
В Word 2003 есть. А так в инете полно. В яндекс лингве точно есть.
А-а-а-а-а... Извини... Это не ко мне.
А файлом одним - нет?
...
Рейтинг: 0 / 0
13.08.2005, 22:34
    #33214353
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Di_LIne Копани Яндекс...

Носом ткни...
AlexeyPro
А-а-а-а-а... Извини... Это не ко мне.
А файлом одним - нет?
К сожалению пока что нет. Но буду парсер свой писать и скорее всего появится. :)
...
Рейтинг: 0 / 0
13.08.2005, 23:21
    #33214367
Andres 1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyPro Di_LIne Копани Яндекс...

Носом ткни...

Ну первый результат же на Google . Стыдно не уметь пользоваться поисковиками - хотя, может, на телефоне или наладоннике форум читаете?

Готовые комплекты для Windows: http://www.luziusschneider.com/Speller/English/index.htm

Словарь для русского языка:
ftp://scon155.phys.msu.su/pub/russian/ispell/rus-ispell.tar.gz

А вот второй результат Яндекса :
Генерация всех словоформ (по мотивам словарей Ispell)
...
Рейтинг: 0 / 0
13.08.2005, 23:25
    #33214372
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Andres 1Стыдно не уметь пользоваться поисковиками - хотя, может, на телефоне или наладоннике форум читаете?

Каюсь... Как то даже в голову не пришло в поисковике вбить. :(
...
Рейтинг: 0 / 0
13.08.2005, 23:27
    #33214376
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Спасибо за табличку. Разбираюсь с ней. Я еще рисуночек выложу со словами (как меду ними связи идут) может что то новое придумается.
...
Рейтинг: 0 / 0
13.08.2005, 23:28
    #33214377
Andres 1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
AlexeyProКак то даже в голову не пришло в поисковике вбить. :(
Это да. Со всеми бывает. Если бы не так, sql.ru процентов на 80-90 похудел бы :)

PS А точно не поисковик нужен? А то один GPL-ный попался на глаза: http://www.htdig.org/
...
Рейтинг: 0 / 0
13.08.2005, 23:41
    #33214380
AlexeyPro
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Структура БД слов и фраз
Поисковик это круто для меня. :) За ссылочку спасибо. Интересно алгоритмы узнать. У меня будет просто БД слов. Т.е. с ее помошью можно будет подбирать списки слов для сайта по какой нибудь теме. Или точнее для сети сайтов объединенных одной темой, например "truck".
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Структура БД слов и фраз / 15 сообщений из 15, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]