Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
В папке куча файлов нтм типа. От 1 до 250000. Задача батником с каждого файла взять по 30 букв из контекста . Повторяю только буквы и никаких body или href так как файлы не тхт а с расширением htm. Имена файлов начинаются от 1.htm до 250000.htm. Возможно некоторых файлов нет так что при несуществующем файле перейти к следующему файлу. Вот примерный грубый алгоритм. Как это осуществить в cmd(батнике) for i=1 то 250000 if folder1\i.htm exist then read folder1\i.htm,30 next i ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.10.2014, 20:24 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Romantiktj, for %i in (*.html) do ( :: тут делаешь что-то с каждым файлом, для примера echo %i ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.10.2014, 10:56 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Romantiktj, А вот с извлечением первых символов без тегов будет проблема - нужна будет какая-то утилитка для парсинга. Парсить файл на cmd - нафиг-нафиг... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.10.2014, 11:03 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Задача батником не решается. Потребуется внешняя утилита, которая загрузит к себе ХТМЛ и вытащит из него его текстовое представление. В принципе такое вполне реализуется в скрипт-процессинге следующего поколения - VBS либо JS, причём не сказать чтобы сильно сложно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.10.2014, 11:53 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Тогда если можно на JS объясните пожалуйста , и если можно вывод определённого количества символов на txt файл, разделение надо поставить символом конца строки. И объясните плзз как запустить JS скрипт. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.10.2014, 13:44 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Romantiktj, Зачем тебе JS, если ты не знаешь, как его запустить? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.10.2014, 14:14 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Вот вот, результат любыми возможными путями , в php нашёл вот этот код но видимо где то ошибаюсь echo file_get_html('http://www.moisait.com/Folder1/5.htm')->plaintext; ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 08:01 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Или для HTM расширения другое используют? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 08:13 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
RomantiktjВот вот, результат любыми возможными путями , в php нашёл вот этот код но видимо где то ошибаюсь echo file_get_html('http://www.moisait.com/Folder1/5.htm')->plaintext; И что выводится? Полный код на php можешь привести? И как ты его пытаешься выполнить тоже. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 11:25 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Проблема в том что ничто не выводится, я просто пример с интеа нашёл, результатов никаких, поэтому прошу помощи в вытаскивании текста без тегов из файлов HTM ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 12:43 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Romantiktj, Ну а сам PHP у тебя стоит? Или ты просто эту строчку куда-то скопировал и ждешь, что она заработает? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 13:32 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Прямо на хосте запускал <?php echo file_get_html('http://konun.tmweb.ru/R/2.htm')->plaintext; ?> результат пустота, но http://konun.tmweb.ru/R/2.htm работает ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 13:55 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Искал читал и ничё не понял, ещё не дорос видимо, возможно хостер не поддерживает чего либо или же какую библиотеку надо подключить ась? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2014, 14:22 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. Сохранить в файл с расширением VBS Исправить пути у папке с HTM файлами и путь к логу Выполнить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2014, 18:40 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Нужно проверить, не остаётся ли в списке процессов iexplore Если остаётся то добавить в скрипт его корректное гашение Файлы не должны содержать скриптов, иначе возможны запросы к пользователю, а поскольку браузер в скрытом режиме то мы их не увидим. Можно выкинуть функцию wait Или исправить так, чтобы не порождала каждый раз объект wscript.shell ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2014, 19:23 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
И забыл про фреймы - по ним еще нужно цикл сделать и сохранять их текст. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2014, 19:49 |
|
||
|
текст из нтм
|
|||
|---|---|---|---|
|
#18+
Раз уж начал, то доделаю: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.10.2014, 11:34 |
|
||
|
|

start [/forum/topic.php?fid=26&msg=38769100&tid=1494437]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
35ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
| others: | 233ms |
| total: | 355ms |

| 0 / 0 |
