powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Тематическое моделирование или тематические термины.
8 сообщений из 8, страница 1 из 1
Тематическое моделирование или тематические термины.
    #38807470
Wisky
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Появилось свободное время и я решила потратить его на невозможное.
Надо определить тему документа. Документ может относиться к нескольким темам.
1) я залила тексты по рубрикам.
2) разбила текст на токены и привела к нормальной форме (сторонний продукт)
3) теперь у меня есть статистика участия слов в темах.

А что мне теперь делать дальше?

P.S. Темы разные по словарному запасу, как определить количество текстов для более точного определения?
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38807474
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
WiskyА что мне теперь делать дальше?
Теперь скармливай эти данные нейронной сети, пусть обучается.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38807522
?Ы
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Wisky,

можно предположить, что есть эталонный базис "чисто тематических частот"

и, соответсвенно, ваше измерение [любая тема -- её спектр (частотный).] -- есть линейная комбинация эталонных векторов. ( с допусками)

предположение не хуже любого другого, [но заведомо неверное -- зависимость от авторов сильно не нулевая]

в этом неверном приближении имеем:
задача -- получить линейную комбинацию, базиса, минимально отличающуюся от измеренного спектра. (наименьшие квадраты)

[-- далее можно пробовать уточнять модельное предположение, вводя квадратичные члены и прочие зависисмости]
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38807527
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Появилось свободное время и я решила потратить его на невозможное.

Не слишком часто встречающаяся модель поведения. :)

> Надо определить тему документа.

Что вы понимаете под темой документа? Есть какие-то ограничения по выбору источников?
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38807712
Wisky
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Зачем здесь нейронные сети?
Слова имеют вес в темах, разве сложив тематические термины мы не получим принадлежности к каждой из тем?
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38807796
Wisky
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Или применение НС скажется на производительности?
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38808959
Жоао
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Wisky,

вероятно, вам сюда или сюда , или даже сюда .
...
Рейтинг: 0 / 0
Тематическое моделирование или тематические термины.
    #38808969
prog123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
WiskyПоявилось свободное время и я решила потратить его на невозможное.
Надо определить тему документа. Документ может относиться к нескольким темам.
1) я залила тексты по рубрикам.
2) разбила текст на токены и привела к нормальной форме (сторонний продукт)
3) теперь у меня есть статистика участия слов в темах.

А что мне теперь делать дальше?

P.S. Темы разные по словарному запасу, как определить количество текстов для более точного определения?

Возьмите себе за правило обследовать базу данных патентов, а не форумов. Текущая практика дремуча, она и мусолится на форумах, - зачем вам это надо?
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Тематическое моделирование или тематические термины.
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]