powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Как лучше организовать
22 сообщений из 22, страница 1 из 1
Как лучше организовать
    #34283135
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Задача такая, есть таблица со словами,например:
Код: plaintext
1.
2.
3.
4.
5.
    id      name
     1    вероятность
     2    работа
     3    состояние
............................
каждое слово имеет ключевой идентификатор как видно.Есть другая таблица,там хрянятся так называемы ключевые слова(или устойчивые словосочетания),например:
Код: plaintext
1.
2.
   id               key_word
   1         вероятность состояния
в поле key_word я бы не хотела хранить сами слова, хочется хранить идентификаторы этих слов,т.е. хочется сделать так, в поле key_word храниться комбинация 13(т.е. 1 соответствует слову: вероятность, а 3 слову: состояние)
Правильно ли так делать подскажите,или есть другой более правильный вариант.
Спасибо
...
Рейтинг: 0 / 0
Как лучше организовать
    #34283163
Kulavert
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
idkey_word_idword_id111213
порядок слов, как вариант, определяется как ORDER BY id
?
...
Рейтинг: 0 / 0
Как лучше организовать
    #34283214
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Kulavertidkey_word_idword_id111213
порядок слов, как вариант, определяется как ORDER BY id
?
ок,спасибочки,а если такая ситуация: в одном и том же предложении есть 2 ключевых слова,т.е.
Код: plaintext
1.
1. вероятность состояния
2. вероятность отказа
как тогда,или предложенная вами структура решает и этот вариант.Точной постановки задачи у меня еще нет,поэтому приходиться задавать такие вопросы.Не ругайте сильно
...
Рейтинг: 0 / 0
Как лучше организовать
    #34283787
Kulavert
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Слова "отказ" в вашем примере не было, поэтому другой вариант:
1. вероятность состояния
2. вероятность работы
idkey_word_idword_id111213321422

Только я не совсем понял, что значит "в одном и том же предложении"? Приведите более полный пример.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34283989
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Задача такая

Исходную задачу опишите.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34284732
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть вопрос: процесс называется марковским,если.....
Есть ответ на этот вопрос,например:
Код: plaintext
Для каждого момента времени Т0, вероятность любого состояния при Т>Т0, зависит только от вероятности состояния в момент времени Т0 и не зависит от вероятностей состояния при Т<Т0
В этом вопросе выделяются ключевые слова (ключевы слова могут состоять из нескольких слов,например как: "вероятность состояния"),т.е. те слова,которые раскрывают смысл предложения, дальше стороятся семантические отношения между словами,например:
слово "вероятность состояния" связано со словом "любого" семантическим отношением "уточнение".В результате мы имеем так называемую формулу предложения.
Пользователь вводит ответ на вопрос на естественном языке,система начинает искать ключевые слова в предложении(или их синонимы),далее ищуться семантические отношения между ними,и потом идет сравнение с эталоном,по результатм сравнения оценка.Ну это все вкратце конечно.Короче мне нужно разобраться,как хранить это все хозяйство в базе данных,какую структуру БД придумать,чтобы все было красиво и эффективно,и чтобы по возможности сохранить свойство масштабируемости.
Я думала так,должна быть табличка с общими словами,например:
Код: plaintext
1.
2.
3.
id       name_word
1       вероятность
2         система
3       состояние
Должна быть таблица,которая получена в результате проведения морфологического анализа всех этих слов,т.е. в ней будут находиться все варианты(окончания,множественное число,единственное и т.д.) употребеления общих слов,например для слова "вероятность",варианты: вероятности,вероятностей,вероятностный и т.д.Должна быть таблица с синонимами этих слов.Далее,должна быть таблица с ключевыми словами,т.е.
Код: plaintext
id               key_word   1         вероятность состояния
Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д.
Вообщем надеюсь более менее меня поняли.Прошу помощи.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285315
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Помогите пожалуйста советом,выше написано
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285342
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ну то есть NLP в чистом виде. Ваша задача только для русского языка или нужна интерлингва?
ONLP, LTC, OntoMap, - что-то из них используете? Готовые лингвистические базы используете?

Вопросы не праздные; мне скоро придется решать такую же задачу, так что можно вместе подумать, как это лучше сделать.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285374
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
guest_20040621Ну то есть NLP в чистом виде. Ваша задача только для русского языка или нужна интерлингва?
ONLP, LTC, OntoMap, - что-то из них используете? Готовые лингвистические базы используете?

Вопросы не праздные; мне скоро придется решать такую же задачу, так что можно вместе подумать, как это лучше сделать.
Для начала только для русского языка.Можно подробнее про ONLP,NLP,LTC...., что это такое.
Вообще я пишу диссертацию по созданию системы тестирования студентов,со свободно-конструированной формой ответа на вопрос.В системе будет реализован морфологический,синтаксический и семантический анализ.Что касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ,ну это я так поделилась просто,вопрос не в этом,а в том как спроектировать правильно структуру БД.
Буду рада сотрудничеству
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285439
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Можно подробнее про ONLP,NLP,LTC...., что это такое.

NLP - natural language processing; ONLP - OpenNLP, библиотека для NLP; LTC - language tree constructor, реализация анализатора. В Сети достаточно материалов и примеров реализаций.

> Вообще я пишу диссертацию по созданию системы тестирования студентов

Интересно. Вообще говоря, для NLP есть гораздо более интересные в коммерческом отношении варианты применения.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285696
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
guest_20040621> Можно подробнее про ONLP,NLP,LTC...., что это такое.

NLP - natural language processing; ONLP - OpenNLP, библиотека для NLP; LTC - language tree constructor, реализация анализатора. В Сети достаточно материалов и примеров реализаций.

> Вообще я пишу диссертацию по созданию системы тестирования студентов

Интересно. Вообще говоря, для NLP есть гораздо более интересные в коммерческом отношении варианты применения.
А есть ли статейки на русском языке какие-нибудь,с английским немножко сложновато.
И все-таки хотелось бы услышать совет по поводу структуры описанной мною БД
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285758
Фотография Сергей Васкецов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ
А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"?
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285787
гм...
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
JulTЯ думала так,должна быть табличка с общими словами,например:
Код: plaintext
1.
2.
3.
id       name_word
1       вероятность
2         система
3       состояние
Должна быть таблица,которая получена в результате проведения морфологического анализа всех этих слов,т.е. в ней будут находиться все варианты(окончания,множественное число,единственное и т.д.) употребеления общих слов,например для слова "вероятность",варианты: вероятности,вероятностей,вероятностный и т.д.Должна быть таблица с синонимами этих слов.
ну я бы тут предложил имхо так:

id parentid name_word type_id (ну тип - чего это падеж, синоним ......)
1 1 вероятность слово
4 1 вероятности множеств.
5 1 вероятностей синоним
................................
2 2 система
10 2 системный
............
3 3 состояние
...........

ну деревянная таблитца такая ...
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285806
гм...
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
авторДалее,должна быть таблица с ключевыми словами,т.е.
id key_word 1 вероятность состояния
Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д.
Вообщем надеюсь более менее меня поняли.Прошу помощи.


тут может быть 2 слова: вероятность состояния ?
или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ?
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285855
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> А есть ли статейки на русском языке какие-нибудь

Застали врасплох. :( Есть, наверное, но навскидку вспоминается только linguist.nm.ru и результаты последнего конкурса Яндекса (поищите в google что-то вроде "результаты программы научных стипендий Яндекса"). Может, что-то содержательное найдете на elbib.ru.

> И все-таки хотелось бы услышать совет по поводу структуры описанной мною БД

Определитесь, что именно будете реализовывать, как и как потом с этим будете работать. Написать ddl - не фокус.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34285918
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
гм... авторДалее,должна быть таблица с ключевыми словами,т.е.
id key_word 1 вероятность состояния
Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д.
Вообщем надеюсь более менее меня поняли.Прошу помощи.


тут может быть 2 слова: вероятность состояния ?
или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ?
теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286079
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ
А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"?
если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286080
гм...
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
JulT гм... авторДалее,должна быть таблица с ключевыми словами,т.е.
id key_word 1 вероятность состояния
Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д.
Вообщем надеюсь более менее меня поняли.Прошу помощи.


тут может быть 2 слова: вероятность состояния ?
или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ?
теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение
ну тогда, т.к. ты хочешь так: для хранения/организации :))
JulT
id key_word 1 вероятность состояния
в поле key_word я бы не хотела хранить сами слова, хочется хранить идентификаторы этих слов,т.е. хочется сделать так, в поле key_word храниться комбинация 13(т.е. 1 соответствует слову: вероятность, а 3 слову: состояние)
+ еще одна таблитца

id1 id2
1 1 вероятность
2 1 состояния
3 1 субстанции
4 1 тра-ля-ля
.................

id1 + id2 - уникально, оба ссылаются на id

правда я не понимаю зачем все это и в лингвистике совсем слаб ... :(
удачи Вам, Барышня! :))
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286162
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
гм... JulT гм... авторДалее,должна быть таблица с ключевыми словами,т.е.
id key_word 1 вероятность состояния
Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д.
Вообщем надеюсь более менее меня поняли.Прошу помощи.


тут может быть 2 слова: вероятность состояния ?
или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ?
теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение
ну тогда, т.к. ты хочешь так: для хранения/организации :))
JulT
id key_word 1 вероятность состояния
в поле key_word я бы не хотела хранить сами слова, хочется хранить идентификаторы этих слов,т.е. хочется сделать так, в поле key_word храниться комбинация 13(т.е. 1 соответствует слову: вероятность, а 3 слову: состояние)
+ еще одна таблитца

id1 id2
1 1 вероятность
2 1 состояния
3 1 субстанции
4 1 тра-ля-ля
.................

id1 + id2 - уникально, оба ссылаются на id

правда я не понимаю зачем все это и в лингвистике совсем слаб ... :(
удачи Вам, Барышня! :))
спасибо
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286322
Фотография Сергей Васкецов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JulT Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ
А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"?
если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК
Мое сообщение следует понимать не как издевку или ехидство или шутку, а как наводку, что от синтаксического анализа не уйти.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286450
JulT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сергей Васкецов JulT Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ
А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"?
если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК
Мое сообщение следует понимать не как издевку или ехидство или шутку, а как наводку, что от синтаксического анализа не уйти.
Спасибо большое,я и не подумала что ты ехидничаешь.
Я только начала работать над этой темой,еще мало что понимаю,но хочу разобраться что к чему,буду рада слышать любые советы и предложения.
...
Рейтинг: 0 / 0
Как лучше организовать
    #34286784
mcureenab
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А оно вообще надо преобразовывать данные в реляционный вид? ИМХО, тут проще и эффективнее хранить файл с образцами правильных ответов на вопрос в сыром виде.
Т.е. таблица выглядит так:
(текст_вопроса, текст_ответа, образцы_ответа, ...)

Где поле образцы_ответа содержит ответ на вопрос в промежуточном коде, который отражает его семантику.

Смысл такой структуры в том, что нам нет надобности искать вопрос подходящий к ответу. Если мы задаём экзаменационный вопрос, то тут же можем загрузить ответ на него (таблицу ключевых слов, и т.п. непонятные мне штучки) прямо из поля образцы_ответа.

Для структурирования поля образцы_ответа можно использовать XML.
...
Рейтинг: 0 / 0
22 сообщений из 22, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Как лучше организовать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]