Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
Приветствую уважаемые знатоки, В кратце: Можно ли построить регулярное выражение которые вырезало бы из текста все двойные слова которые стоят рядом и начинаются с большой буквы? Длиное описани проблемы: у меня немного не стандартная задача для моего проекта нужно анализировать новости приходящие через rss. Но проблема в том, что анализировать их нужно на предмет появления известных имен и фамилий. Проект у меня о людях вот и возникла идея попытаться анализировать происходящее. Для примера новость: авторKansas State football coach Bill Snyder says he is cautiously optimistic about the upcoming season, but that mood only applies to today. He may think differently tomorrow, next week or next month. таких новостей как вы понимаете в день более 300 а может и более, человеку просматривать не реально, а вот обратить внимание на какую-то новость про человека вполне можно если проверить фамилию Bill Snyder на совпадение в нашей базе данных (у нас уже более 80тыс людей). Как вы понимаете сделать поиск по каждому имени и фамилии человека и новости только что пришедшей не реально так как будет колбасить каждую проверку более 15 минут. У меня возникла другая идея можно ли написать регулярное выражение которое бы проверяла и выделяла в тексте все двойные слова которые написаны с заглавных букв? На данном примере это бы было: Kansas State и Bill Snyder Далее понятно что проверка будет проходить на передмет всех 80тыс собранных людей но это всего два запроса в отличие от 80тыс запросов против каждой новости. Есть ли какие-нибудь идеи или хотя бы подскажите возможно ли такое? Модератор: Название темы откорректировано. Пожалуйста, указывайте тему обсуждения более корректно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2014, 01:07 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
alexnewsПриветствую уважаемые знатоки, В кратце: Можно ли построить регулярное выражение которые вырезало бы из текста все двойные слова которые стоят рядом и начинаются с большой буквы? Что такое "двойные слова" Двысловы рядом и оба с большой буквы! Такое регуляркой распознавать можно, но как я понимяю на до сначала вычленять из текста по два слова а потом проверять их. А это гемарой! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2014, 23:13 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
alexnewsслова которые стоят рядом и начинаются с большой буквыРегекспом, вроде такого: Код: php 1. находите пары слов. Затем убираете лишние пробелы (ну мало ли чего там редакторам/писателям взбредет). И передаете эту строку в запрос к БД. Вроде всё просто. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2014, 23:42 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
А если будет упомянута иолько фамилия, или псевдрним в случае с артистами? или это вам обрабатывать не надо? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 09:11 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
vklealexnewsслова которые стоят рядом и начинаются с большой буквыРегекспом, вроде такого: Код: php 1. находите пары слов. Затем убираете лишние пробелы (ну мало ли чего там редакторам/писателям взбредет). И передаете эту строку в запрос к БД. Вроде всё просто. А куда например регулярно пойти бедному Полу Маккартни( Paul McCartney ) или Майкл Дж Фоксу( Michael J. Fox )? )) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 15:51 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
volodin661, Тоже думал об этом. Однако, автор не упоминал ни о заглавной букве в середине слова, ни о заглавной букве с точкой... А упомянет эти, так потом мож еще чего захочется искать. Например, О'Генри :-) Потому не стал отклоняться от примеров в ТЗ. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 16:03 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
AreostarА если будет упомянута иолько фамилия, или псевдрним в случае с артистами? или это вам обрабатывать не надо? надо конечно, но пока не реально к сожалению. У меня простое выражение не получилось а вы говорите еще задавать условия на каждое слово с большой буквы. Это же какой объем информации нужно будет проверить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 19:03 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
vklevolodin661, Тоже думал об этом. Однако, автор не упоминал ни о заглавной букве в середине слова, ни о заглавной букве с точкой... А упомянет эти, так потом мож еще чего захочется искать. Например, О'Генри :-) Потому не стал отклоняться от примеров в ТЗ. запустить бы этот пример, тогда можно было бы думать о продолжении. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 19:05 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
alexnewsvkle, Код: php 1. приношу свои извинения vkle, работает как часы это я с тормозил, давно не писал код. Спасибо Огромное это было так просто. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 19:35 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
все классно, только возникла другая проблема: Парсер дергает все с заданной страницы а соответственно на странице не только статья но и еще анонсы других статей что делает не реальным автоматический анализ статей. Печально конечно я об этом не подумал. В результате с одной страницы собирается более 600 пар слов из них 590 бесполезных. 8 имена с других анонсов и только 2 полезных. Может у кого-нибудь есть более продуктивная идея? Заранее буду благодарен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 21:18 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
alexnewsна странице не только статья но и еще анонсы других статей Приметно так: 1. Пользуясь набором некоторых признаков (теги, классы, каменты и т.п.), определить границы статьи. 2. Взять полезный текст из этих границ (или удалить ненужное). 3. Искать в полезном тексте. Еще вариант: поискать альтернативный источник исходных данных, где нет бесполезного текста. Например, RSS. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2014, 22:08 |
|
||
|
Как найти пары слов с Заглавной Буквы в тексте?
|
|||
|---|---|---|---|
|
#18+
vkle, Вы мне просто помогли воплотить мою мечту в жизнь!! Спасибо Вам огромное. C RSS все просто супер хватает и нет кучи бесполезных слов. Еще бы как-то таких как Shaquille O'Neal и John McEnroe отслеживать то вообще было бы суперски. Но мечта уже сбылась, будем отслеживать свежие новости и переводить самое интересное. Еще раз спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.07.2014, 01:20 |
|
||
|
|

start [/forum/topic.php?fid=23&msg=38705125&tid=1462572]: |
0ms |
get settings: |
8ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
53ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
| others: | 219ms |
| total: | 360ms |

| 0 / 0 |
