|
|
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Задача такая, есть таблица со словами,например: Код: plaintext 1. 2. 3. 4. 5. Код: plaintext 1. 2. Правильно ли так делать подскажите,или есть другой более правильный вариант. Спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.01.2007, 18:20 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
idkey_word_idword_id111213 порядок слов, как вариант, определяется как ORDER BY id ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.01.2007, 18:26 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Kulavertidkey_word_idword_id111213 порядок слов, как вариант, определяется как ORDER BY id ? ок,спасибочки,а если такая ситуация: в одном и том же предложении есть 2 ключевых слова,т.е. Код: plaintext 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.01.2007, 18:41 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Слова "отказ" в вашем примере не было, поэтому другой вариант: 1. вероятность состояния 2. вероятность работы idkey_word_idword_id111213321422 Только я не совсем понял, что значит "в одном и том же предложении"? Приведите более полный пример. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 06:58 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
> Задача такая Исходную задачу опишите. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 09:12 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Есть вопрос: процесс называется марковским,если..... Есть ответ на этот вопрос,например: Код: plaintext слово "вероятность состояния" связано со словом "любого" семантическим отношением "уточнение".В результате мы имеем так называемую формулу предложения. Пользователь вводит ответ на вопрос на естественном языке,система начинает искать ключевые слова в предложении(или их синонимы),далее ищуться семантические отношения между ними,и потом идет сравнение с эталоном,по результатм сравнения оценка.Ну это все вкратце конечно.Короче мне нужно разобраться,как хранить это все хозяйство в базе данных,какую структуру БД придумать,чтобы все было красиво и эффективно,и чтобы по возможности сохранить свойство масштабируемости. Я думала так,должна быть табличка с общими словами,например: Код: plaintext 1. 2. 3. Код: plaintext Вообщем надеюсь более менее меня поняли.Прошу помощи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 11:57 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Помогите пожалуйста советом,выше написано ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 13:58 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Ну то есть NLP в чистом виде. Ваша задача только для русского языка или нужна интерлингва? ONLP, LTC, OntoMap, - что-то из них используете? Готовые лингвистические базы используете? Вопросы не праздные; мне скоро придется решать такую же задачу, так что можно вместе подумать, как это лучше сделать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 14:03 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
guest_20040621Ну то есть NLP в чистом виде. Ваша задача только для русского языка или нужна интерлингва? ONLP, LTC, OntoMap, - что-то из них используете? Готовые лингвистические базы используете? Вопросы не праздные; мне скоро придется решать такую же задачу, так что можно вместе подумать, как это лучше сделать. Для начала только для русского языка.Можно подробнее про ONLP,NLP,LTC...., что это такое. Вообще я пишу диссертацию по созданию системы тестирования студентов,со свободно-конструированной формой ответа на вопрос.В системе будет реализован морфологический,синтаксический и семантический анализ.Что касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ,ну это я так поделилась просто,вопрос не в этом,а в том как спроектировать правильно структуру БД. Буду рада сотрудничеству ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 14:09 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
> Можно подробнее про ONLP,NLP,LTC...., что это такое. NLP - natural language processing; ONLP - OpenNLP, библиотека для NLP; LTC - language tree constructor, реализация анализатора. В Сети достаточно материалов и примеров реализаций. > Вообще я пишу диссертацию по созданию системы тестирования студентов Интересно. Вообще говоря, для NLP есть гораздо более интересные в коммерческом отношении варианты применения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 14:23 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
guest_20040621> Можно подробнее про ONLP,NLP,LTC...., что это такое. NLP - natural language processing; ONLP - OpenNLP, библиотека для NLP; LTC - language tree constructor, реализация анализатора. В Сети достаточно материалов и примеров реализаций. > Вообще я пишу диссертацию по созданию системы тестирования студентов Интересно. Вообще говоря, для NLP есть гораздо более интересные в коммерческом отношении варианты применения. А есть ли статейки на русском языке какие-нибудь,с английским немножко сложновато. И все-таки хотелось бы услышать совет по поводу структуры описанной мною БД ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 15:20 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 15:33 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
JulTЯ думала так,должна быть табличка с общими словами,например: Код: plaintext 1. 2. 3. ну я бы тут предложил имхо так: id parentid name_word type_id (ну тип - чего это падеж, синоним ......) 1 1 вероятность слово 4 1 вероятности множеств. 5 1 вероятностей синоним ................................ 2 2 система 10 2 системный ............ 3 3 состояние ........... ну деревянная таблитца такая ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 15:38 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
авторДалее,должна быть таблица с ключевыми словами,т.е. id key_word 1 вероятность состояния Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д. Вообщем надеюсь более менее меня поняли.Прошу помощи. тут может быть 2 слова: вероятность состояния ? или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 15:44 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
> А есть ли статейки на русском языке какие-нибудь Застали врасплох. :( Есть, наверное, но навскидку вспоминается только linguist.nm.ru и результаты последнего конкурса Яндекса (поищите в google что-то вроде "результаты программы научных стипендий Яндекса"). Может, что-то содержательное найдете на elbib.ru. > И все-таки хотелось бы услышать совет по поводу структуры описанной мною БД Определитесь, что именно будете реализовывать, как и как потом с этим будете работать. Написать ddl - не фокус. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 15:53 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
гм... авторДалее,должна быть таблица с ключевыми словами,т.е. id key_word 1 вероятность состояния Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д. Вообщем надеюсь более менее меня поняли.Прошу помощи. тут может быть 2 слова: вероятность состояния ? или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ? теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 16:07 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"? если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 16:35 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
JulT гм... авторДалее,должна быть таблица с ключевыми словами,т.е. id key_word 1 вероятность состояния Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д. Вообщем надеюсь более менее меня поняли.Прошу помощи. тут может быть 2 слова: вероятность состояния ? или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ? теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение ну тогда, т.к. ты хочешь так: для хранения/организации :)) JulT id key_word 1 вероятность состояния в поле key_word я бы не хотела хранить сами слова, хочется хранить идентификаторы этих слов,т.е. хочется сделать так, в поле key_word храниться комбинация 13(т.е. 1 соответствует слову: вероятность, а 3 слову: состояние) + еще одна таблитца id1 id2 1 1 вероятность 2 1 состояния 3 1 субстанции 4 1 тра-ля-ля ................. id1 + id2 - уникально, оба ссылаются на id правда я не понимаю зачем все это и в лингвистике совсем слаб ... :( удачи Вам, Барышня! :)) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 16:35 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
гм... JulT гм... авторДалее,должна быть таблица с ключевыми словами,т.е. id key_word 1 вероятность состояния Должна быть таблица с семантическими отношениями и так же с синонимами к этим отношениям и т.д. Вообщем надеюсь более менее меня поняли.Прошу помощи. тут может быть 2 слова: вероятность состояния ? или все что угодно, типа: вероятность состояния некоей субстанции тра-ля-ля ... ? теоретически может,но не более приблизительно 4 слов,иначе это уже вроде как отдельное предложение ну тогда, т.к. ты хочешь так: для хранения/организации :)) JulT id key_word 1 вероятность состояния в поле key_word я бы не хотела хранить сами слова, хочется хранить идентификаторы этих слов,т.е. хочется сделать так, в поле key_word храниться комбинация 13(т.е. 1 соответствует слову: вероятность, а 3 слову: состояние) + еще одна таблитца id1 id2 1 1 вероятность 2 1 состояния 3 1 субстанции 4 1 тра-ля-ля ................. id1 + id2 - уникально, оба ссылаются на id правда я не понимаю зачем все это и в лингвистике совсем слаб ... :( удачи Вам, Барышня! :)) спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 16:50 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
JulT Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"? если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК Мое сообщение следует понимать не как издевку или ехидство или шутку, а как наводку, что от синтаксического анализа не уйти. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 17:27 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
Сергей Васкецов JulT Сергей Васкецов JulTЧто касается синтаксического,то тут стоит вопрос можно ли отойти от него,и переложить всю нагрузку на семантический анализ А если вопрос студенту как раз про синтаксический и семантический анализы? Типа, "убить нельзя помиловать"? если бы ответ на данный вопрос был так прост,мы бы уже на ура общались с ПК Мое сообщение следует понимать не как издевку или ехидство или шутку, а как наводку, что от синтаксического анализа не уйти. Спасибо большое,я и не подумала что ты ехидничаешь. Я только начала работать над этой темой,еще мало что понимаю,но хочу разобраться что к чему,буду рада слышать любые советы и предложения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 18:06 |
|
||
|
Как лучше организовать
|
|||
|---|---|---|---|
|
#18+
А оно вообще надо преобразовывать данные в реляционный вид? ИМХО, тут проще и эффективнее хранить файл с образцами правильных ответов на вопрос в сыром виде. Т.е. таблица выглядит так: (текст_вопроса, текст_ответа, образцы_ответа, ...) Где поле образцы_ответа содержит ответ на вопрос в промежуточном коде, который отражает его семантику. Смысл такой структуры в том, что нам нет надобности искать вопрос подходящий к ответу. Если мы задаём экзаменационный вопрос, то тут же можем загрузить ответ на него (таблицу ключевых слов, и т.п. непонятные мне штучки) прямо из поля образцы_ответа. Для структурирования поля образцы_ответа можно использовать XML. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.01.2007, 20:52 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=34284732&tid=1544766]: |
0ms |
get settings: |
9ms |
get forum list: |
20ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
159ms |
get topic data: |
9ms |
get forum data: |
3ms |
get page messages: |
47ms |
get tp. blocked users: |
1ms |
| others: | 215ms |
| total: | 469ms |

| 0 / 0 |
