|
|
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
Здарова челы. Задумался я о прогнозировании появления следующего английского слова в англоязычном тексте. В качестве примера взял тексты Jack London - Call Of Wild. В качестве способа анализа и наблюдения - цепь маркова. Цепь Маркова - или Марковская цепь (Markov Chain) это орграф дуги которого имеют "вероятности срабатывания". Используя такой орграф можно построить архиватор базирующийся на особенностях языка. Можно исследовать особенности языка. И можно (наверное) составить профиль писателя или жанра. (В данном конкретном анализе я не ищу способа построить оптимальный архиватор. А просто хочу для себя поразбираться с графами и методами их визуализации типа (Graphviz)) Входные данные: http://london.sonoma.edu/writings/CallOfTheWild/ Выходные данные: Отчет по дуг отранжированных по количеству исходящих связей Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. по алфавиту Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Примечание 1 Без фильтрации не обошлось. Я убрал из текста пробелы, знаки пунктуации и оставил только alpha-num + символ апострофа + символ дефиса (hyphen). Примечание 2 Графический пакет graphviz в состоянии отработать только 2000 вершин. При большем количестве exe-шник аварийно завершает свою работу... вобщем буду искать ему альтернативу. Примечание 1 Без фильтрации не обошлось. Я убрал из текста пробелы, знаки пунктуации и оставил только alpha-num + символ апострофа + символ дефиса (hyphen). Примечание 2 Графический пакет graphviz в состоянии отработать только 2000 вершин. При большем количестве exe-шник аварийно завершает свою работу... вобщем буду искать ему альтернативу. Чуть позже приаттачу картинку-орграф. Вобщем кому любопытно - пишите в каментах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.03.2016, 19:58 |
|
||
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
mayton, молодец, я бы тоже поковырять хотел что-то такое. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.03.2016, 11:21 |
|
||
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
maytonГрафический пакет graphviz в состоянии отработать только 2000 вершин. При большем количестве exe-шник аварийно завершает свою работу... вобщем буду искать ему альтернативу. С graphviz я тупо не разобрался. В нём насколько я понял - разные утилиты для разных типов (или классов графов). Я использовал dot а он не тянет много вершин. Немного помогли утилиты 2Pi(twopi) и sfdp которые могут рисовать более 2к вершин но делают рёбра прямые. Что в моём случае неудобно. Остался за кадром вопрос как сделать "make planar graph" (не могу подобрать глагол - расплющивание, распланаривание) чтобы вершины располагались не навалом и рёбра пересекались по минимуму. Также нужны некоторые важные опции такие как поместить в центр главную вершину или наиболее мощную вершину, выделить клику и пометить разными цветами вершины и рёбра. Проставить на рёбрах маркеры (вероятности переходов). Без планарности картика такая (sfdp renderer): ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.03.2016, 12:20 |
|
||
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
maytonС graphviz я тупо не разобрался. В нём насколько я понял - разные утилиты для разных типов (или классов графов). да. сирко пытается делать типа круглые графы, а дот направленные. Остальные утилиты я забыл. вот один пример Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. пысы более 2000 я делать не пробовал, графиз поставляется еще и как библиотека, может можно включить ее в свой код и добиваться больше чем 2000. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.03.2016, 14:08 |
|
||
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
наоборот. прошлый на цирко. текущий на дот ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.03.2016, 14:09 |
|
||
|
Тяпничная цепь Маркова и визуализация графов
|
|||
|---|---|---|---|
|
#18+
maytonТакже нужны некоторые важные опции такие как поместить в центр главную вершину или наиболее мощную вершину, выделить клику и пометить разными цветами вершины и рёбра. : там есть кластеры различной важности(rank), в которые объединяются вершины. Код: xml 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.03.2016, 14:15 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=39192024&tid=1340763]: |
0ms |
get settings: |
8ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
151ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
50ms |
get tp. blocked users: |
1ms |
| others: | 222ms |
| total: | 467ms |

| 0 / 0 |
