Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Тематическое моделирование или тематические термины. / 8 сообщений из 8, страница 1 из 1
16.11.2014, 14:30
    #38807470
Wisky
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
Появилось свободное время и я решила потратить его на невозможное.
Надо определить тему документа. Документ может относиться к нескольким темам.
1) я залила тексты по рубрикам.
2) разбила текст на токены и привела к нормальной форме (сторонний продукт)
3) теперь у меня есть статистика участия слов в темах.

А что мне теперь делать дальше?

P.S. Темы разные по словарному запасу, как определить количество текстов для более точного определения?
...
Рейтинг: 0 / 0
16.11.2014, 14:44
    #38807474
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
WiskyА что мне теперь делать дальше?
Теперь скармливай эти данные нейронной сети, пусть обучается.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
16.11.2014, 16:01
    #38807522
?Ы
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
Wisky,

можно предположить, что есть эталонный базис "чисто тематических частот"

и, соответсвенно, ваше измерение [любая тема -- её спектр (частотный).] -- есть линейная комбинация эталонных векторов. ( с допусками)

предположение не хуже любого другого, [но заведомо неверное -- зависимость от авторов сильно не нулевая]

в этом неверном приближении имеем:
задача -- получить линейную комбинацию, базиса, минимально отличающуюся от измеренного спектра. (наименьшие квадраты)

[-- далее можно пробовать уточнять модельное предположение, вводя квадратичные члены и прочие зависисмости]
...
Рейтинг: 0 / 0
16.11.2014, 16:08
    #38807527
guest_20040621
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
> Появилось свободное время и я решила потратить его на невозможное.

Не слишком часто встречающаяся модель поведения. :)

> Надо определить тему документа.

Что вы понимаете под темой документа? Есть какие-то ограничения по выбору источников?
...
Рейтинг: 0 / 0
16.11.2014, 23:46
    #38807712
Wisky
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
Зачем здесь нейронные сети?
Слова имеют вес в темах, разве сложив тематические термины мы не получим принадлежности к каждой из тем?
...
Рейтинг: 0 / 0
17.11.2014, 07:45
    #38807796
Wisky
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
Или применение НС скажется на производительности?
...
Рейтинг: 0 / 0
18.11.2014, 00:57
    #38808959
Жоао
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
Wisky,

вероятно, вам сюда или сюда , или даже сюда .
...
Рейтинг: 0 / 0
18.11.2014, 01:18
    #38808969
prog123
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Тематическое моделирование или тематические термины.
WiskyПоявилось свободное время и я решила потратить его на невозможное.
Надо определить тему документа. Документ может относиться к нескольким темам.
1) я залила тексты по рубрикам.
2) разбила текст на токены и привела к нормальной форме (сторонний продукт)
3) теперь у меня есть статистика участия слов в темах.

А что мне теперь делать дальше?

P.S. Темы разные по словарному запасу, как определить количество текстов для более точного определения?

Возьмите себе за правило обследовать базу данных патентов, а не форумов. Текущая практика дремуча, она и мусолится на форумах, - зачем вам это надо?
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Тематическое моделирование или тематические термины. / 8 сообщений из 8, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]