|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Вопрос, потянет ли Акцесс с миллионом записей и что из кода можно найти здесь для реализации схемы на картинке. Одна запись (в сумме все поля) может тянуть на 2 кб символьного представления. Желательно применить язык поиска (как в яндекс поиске), либо regexp на край. Принципиальна скорость пересчета таблиц 4 и 6 семантических мепингов. /что смутно - спрашивайте ... |
|||
:
Нравится:
Не нравится:
|
|||
14.01.2020, 21:44 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Да справится, чего бы не справиться-то? только я бы делал это всё же кодом на VBA, а не запросами... ... |
|||
:
Нравится:
Не нравится:
|
|||
14.01.2020, 23:07 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
А я бы "легкие" случаи решил Jet-ом (их большинство, полагаю), а "нестандартные" уже можно и МИФ-ом добить. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.01.2020, 23:17 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Заголовок скрина "Классификация записей по классам(типам) должностей" наталкивает на одну мыслю-а что мешает добавить в таблицу поле [типДолжности] и создать справочник типов ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 00:37 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Миллион записей по 2 кб - это 2Гб, а начиная уже с 1.5 Гб Акцесс начинает глючить. По картинке не видно тип поля должности. Если это просто текст, а не поле подстановки с кодом, то полное сканирование миллиона строк будет занимать вечность. Насколько я понимаю, требуется отбор людей по типу должности? В этом случае нужно будет полное сканирование, результат вас неприятно удивит. Обязательно должен быть индекс для отбора записей в основной таблице. Можно добавить поле с кодом типа должности, по нему отбор будет идти быстро. Заполнить этот код можно один раз при создании или изменении должности. Вообще для анализа данных по колонкам в таблицах с большим числом записей Акцесс далеко не лучшая база. Идеально работают базы с колоночным типом хранения данных типа MariaDB ColumnStore - анализ данных в колонке при паре миллионов записей занимает доли секунды. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 05:23 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Predeclared я бы "легкие" случаи решил Jet-ом (их большинство, полагаю) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 07:42 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
MrShin Миллион записей по 2 кб - это 2Гб, а начиная уже с 1.5 Гб Акцесс начинает глючить. По картинке не видно тип поля должности. Уточню конечную задачу. Этот пример с должностями упрощённый, в реальной БД десятки полей, с текстовым представлением, которые хотелось бы объединить как текст и по ним искать шаблоны. Итак. Задача классифицировать записи по принадлежности к темам, основываясь на тексте полей и сочетаниях значений полей. Размерностей тематик - больше 1, т.е. справочник тем по контексту 1, отдельный справочник по контексту 2 - от 5 до десятков контекстов. Контекст, для понимания, например - это тип должности по иерархии управления, или отнесение статьи к случаю применения agile и гибких методов управления проектами. Текст написан людьми и не всегда без ошибок, много синонимов, терминов, склонения. Таких записей сейчас например 1 млн., десятки контекстов, каждый контекст может иметь десяток шаблонов. Решать задачу перебором 1млн Х 100 Х 10 записей? потянет акцесс? Или колоночные БД - единственно производительный вариант? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 10:41 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
sdku Заголовок скрина "Классификация записей по классам(типам) должностей" наталкивает на одну мыслю-а что мешает добавить в таблицу поле [типДолжности] и создать справочник типов Это не задача класса "создать учетную систему", где все типы заранее стабилизированы. Задача поиска контекста в тексте, который бы относил запись к тому или иному типу. В этом же примере Тип должности опирается на набор поисковых шаблонов и текст "директор" можно отнести как топ-позиции "генеральный директор", так и к линейной "директор проекта". ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 10:49 |
|
Семантическая классификация в Access - справится?
|
|||
---|---|---|---|
#18+
Akina ..., но "лёгких" случаев не предвидится... Да, я уже это понял. Первоначальная задача "дайте воды напиться" переросла в "что и переночевать негде". :) Akina ..., и закончится, скорее всего, переполнением файла БД... Решение этой задачи - хороший повод подергать многоядерный процессор за все его титьки ядра. Или в новомодных версиях Access уже научили Jet и VBA задействовать все ядра? (я не нашел ответа в спецификации) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2020, 17:56 |
|
|
start [/forum/topic.php?fid=45&fpage=22&tid=1610284]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
39ms |
get topic data: |
14ms |
get forum data: |
3ms |
get page messages: |
52ms |
get tp. blocked users: |
2ms |
others: | 303ms |
total: | 444ms |
0 / 0 |