|
|
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Всем привет. Ребята подскажите. Есть строка </nobr, Закарпатская обл.</a, ее надо разбить чтобы получилось Закарпатская у меня есть код Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. как указать пробелы String[] str = parsCountry.get(i).toString().split(">"); ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.09.2015, 20:08 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Парсить HTML регулярными выражениями не очень хорошая идея. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 08:46 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Слово "парсить" не существует, поэтому "парсить" действительно неудачная идея. Регулярных выражений в этом некачественном примере нет (или можно сказать есть, но тривиальные), а "парсить" эту строку проще всего именно регулярным выражением. Я сразу не ответил потому, что приведённый пример интересующей части строки явно неточный. Ну, объясняю как работает некачественный пример. Аффтар сначала делит строку на части по символам ">", берёт 4-ю по порядку, в которой очевидно содержится что-то закарпатское. Затем выполняет лишнюю операцию копирования результата в другой список. Затем просматривает другой список и делит строки из него на части по символу "<", чтобы отбросить хвост строки после закарпатского. Очевидно, что-то закарпатское содержится в первой из полученных частей, поэтому она и берётся в качестве результата. Однако результатом является "Закарпатская обл.", а нужно просто "Закарпатская". Этого можно добиться, дополнительно разбив результат по символу пробела. Пример. Код: java 1. 2. 3. Результат: "Закарпатская". В этом примере предполагается, что между "Закарпатская" и "обл." есть один пробел. Если их может быть несколько, то для их уловления можно применить настоящее регулярное выражение: Код: java 1. 2. 3. Результат: "Закарпатская". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 09:36 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
BlazkowiczПарсить HTML регулярными выражениями не очень хорошая идея. Подскажите а какая идея самая лутшая для парсинга HTML. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 09:40 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
mixon21Подскажите а какая идея самая лутшая для парсинга HTML. HTML парсер, как ни странно. http://stackoverflow.com/questions/2168610/which-html-parser-is-the-best ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 09:42 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
mixon21BlazkowiczПарсить HTML регулярными выражениями не очень хорошая идея. Подскажите а какая идея самая лутшая для парсинга HTML. http://jsoup.org/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 09:43 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Mixon21Подскажите а какая идея самая лутшая для парсинга HTML. Никакая, поскольку слово "парсинг" не существует и следовательно ничего не означает. Поэтому про него не может быть идей. Предлагаемые вам (как ни странно) "парсеры" создают DOM-модель HTML-документа. Спрашивается: а оно надо, всего лишь для извлечения слова "Закарпатская" из таблицы? Для чего достаточно добавить к вашему коду указанную мной строку. Иногда конечно DOM-модель бывает нужна, отчего и существуют эти, как некоторые неграмотно выражаются, парсеры (разборщики HTML). Но это надо самостоятельно решать, когда нужно использовать, а когда нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 11:46 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Partisan MСлово "парсить" не существует ... Не будьте столь категоричны. Это уже вполне устоявшийся термин. Если такого слова не существовало бы то тогда вряд ли бы Вы и я и многие другие, поняли что имел ввиду блазковиц BlazkowiczПарсить HTML регулярными выражениями не очень хорошая идея. Все таки намного быстрее написать "парсить" нежели "выполнить синтаксический анализ". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 11:58 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
mixon21, твоя задача разбита на 2 фазы. 1) Парсинг собственно HTML документа с использованием HTMLCleaner или JSoup (погугли сам их описание). 2) После получения ноды или элемента (или строки) которая лежит внутри ее нужно разбить либо по SPACERS, CONTROLS если есть возможность с использованием Apache String Utils либо подключить регулярки (в том случае если тривиально не получается). Слово парсинг объективно существует в рамках наших внутренних девелоперских договорённостей и мы все прекрасно поняли о чём идёт речь. Учёным и специалистам в области анализа текста я предлагаю не спекулировать на эту тему в этом форуме. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 12:17 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Изврат ) Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 12:37 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
llemingВсе таки намного быстрее написать "парсить" нежели "выполнить синтаксический анализ"."(с)делать разбор/разобрать" - тоже не очень длинно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 18:02 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
mixon21, Код: java 1. 2. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 19:46 |
|
||
|
Разбивка строки Split
|
|||
|---|---|---|---|
|
#18+
Usmanmixon21, Код: java 1. 2. Со split 'ом тоже вроде работает (-: ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.09.2015, 19:49 |
|
||
|
|

start [/forum/topic.php?fid=59&msg=39046213&tid=2124966]: |
0ms |
get settings: |
11ms |
get forum list: |
19ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
201ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
68ms |
get tp. blocked users: |
1ms |
| others: | 249ms |
| total: | 572ms |

| 0 / 0 |
