|
Как распарсить письмо из Outlook в HTML формате?
|
|||
---|---|---|---|
#18+
Доброго времени суток, ситуация такая: Есть письмо, отправленное из Outlook 2010 в HTML формате, нужно его распарсить, выдернув непосредственно текст сообщения. Собственно код письма: Код: html 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58.
Код: pascal 1. 2. 3. 4.
Но при проверке кода ошибки имею такое сообщение: Код: xml 1. 2. 3. 4. 5. 6.
Я так понимаю, что тег <meta> должен иметь закрывающую скобку, типа </meta> или хотя бы просто </>, но в коде письма, формируемом Outlook его нет. Это правильно или это особенность outlook? Можно ли как-нибудь обойти проверку на эти теги при парсинге, чтобы документ рапспарсился и я мог его дальше дербанить стандартными методами DomDocument? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.07.2017, 12:34 |
|
Как распарсить письмо из Outlook в HTML формате?
|
|||
---|---|---|---|
#18+
Это не XML документ и, соответственно, XML парсеры его парсить не будут. Вам нужен HTML парсер. Например, MSHTML ... |
|||
:
Нравится:
Не нравится:
|
|||
24.07.2017, 22:29 |
|
Как распарсить письмо из Outlook в HTML формате?
|
|||
---|---|---|---|
#18+
_Vasilisk_, Вопрос решил. С помощью регулярки выкинул все теги(rexp.replace), на выходе чисты текст сообщения, то что нужно :) ... |
|||
:
Нравится:
Не нравится:
|
|||
25.07.2017, 12:15 |
|
|
start [/forum/search_topic.php?author=psybuffoon&author_mode=last_posts&do_search=1]: |
0ms |
get settings: |
12ms |
get forum list: |
12ms |
get settings: |
11ms |
get forum list: |
14ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
32ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
2ms |
others: | 20026ms |
total: | 20210ms |
0 / 0 |