+1 Капча это не только облом для спамеров, это ещё и оцифровка многих страниц текста т.ч. нравится, не нравится а двойная польза перевешивает всякие неудобства.
Я его применяю у себя в дневнике уже который год и результат потрясающий!
Это мега-супер-программа интеллектуальной фильтрации спама! Она короткая. Очень. Всего одна строчка на PHP:
if(eregi("[a-z]+\.[a-z]+",preg_replace("/p\.s/si","",$TEXT))) { /* ЭТО СПАМ */ }
Физический смысл: если русскоязычный пользователь оставляет комментарий, в котором встречается комбинация из двух латинских букв, разделенных точкой без пробелов, то это однозначно ссылка ("P.S." мы понимаем). А ссылка - это с большой вероятностью спам. Потому что без ссылок спам теряет свой смысл.
Поэтому такие комментарии автоматически становятся невидимы. А я потом приду и посмотрю, что открыть, а что удалить.
Тем, кто писал честные комментарии со ссылками, не влом потерпеть. А спамер обламывается.
Господи, как они тупят, если вручную шлют! Редактируют свой пост и снова пытаются отправить - то выражение "продается на нашем сайте" попробуют написать латиницей, то http отрежут, то www уберут, то тэгами окружат, то BB-тэгами... И все равно робот их посылает нахуй и говорит, что комментарий скрыт. А они не могут понять, как их вычислили ;)))
А роботоспам прекратился со вводом капчи. Я вот думаю убрать ее, капчу. И без нее все прекрасно.
Это могут делать стэндалоны вроде меня. Либо - что я и предлагаю - сделать опцию "скрывать комментарии со ссылками" в движке ЖЖ, чтобы включать по желанию.
А если спамер использует IP address вместо домайна: http://192.23.24.45/stuff/ Тогда ваш "гениальный" фильтр обосрется. И вообше ваш regex извините, хреноват. Если вы уж решли использовать regex то напрягите мозги и напишите получше.
ОК, а если домайн кирилицей? Кстати с IP вместо домаин много сайтов связанных с рекламой.
Насчот regex: вы же сами говорите что "в котором встречается комбинация из двух латинских букв, разделенных точкой без пробелов" а ваш regex ловит все комбинации где один или более латинских букв резделенных точкой.
И потом если уж ловить по такому признаку то домайн любой оканчивается на точку + минимум 2 буквы. ОК, если говорить о домайнах, то домайн может быть и такой: site9.com в данном случае ваш regex его тоже не поймает. Хотя-бы исходя из етого regex будет такой: if(preg_match('/[a-zA-Z0-9]\.[a-zA-Z0-9]{2,}/msi, $text')){ // spam }
Но ето только самые минимальные улучьшения. Реальнее было-бы ловить линки по признаку того что линк всегда имеет в себе 'http' + иногда 's' + '://'
Учитесь смолоду решать конкретные проблемы, а не моделировать ситуации для сферического спамера в вакууме. Где вы видели спамеров с кирилическими доменами? Где вы вообще видели кириллический домен в реальном использовании?
Та же проблема у вас и в программировании. Две буквы через точку, это - вида "a.b" или "u.r". Нахуя две буквы городить? Этого АБСОЛЮТНО достаточно для выявления любых линков в тексте русского комментария. За исключением случая "p.s", но вы даже не смогли понять, где в моей строке он обрабатывается. Идите ловите свои http - ну и будете получать спам с именами через www или вообще без префикса, спамеру похуй, его задача - засветить линк в раскрученном журнале чтобы проиндексироваться в поисковике. Вы даже этого не понимаете?
Понятно теперь про p.s, а другие сокращения как-же? Они тоже будут считаться спамом?
А если линк без http:// a просто www.site.com то он будет выглядеть линком или просто как техт в бровзере? Конечно если в ЖЖ есть функция автоматически строку типа www.site.com делать линком то можно и это учитывать. Почему-бы не улучшить? Вообще со спамом бороться не так просто как написав одну regex строку.
Разработка программы обходящей капчу в кругах фрилансеров давно не оценивается дороже чем 200 долларов. Подобные плагины к популярным спамерским программам продаются не дороже чем за 99. Вы думаете спамеры настолько обнищали что экономят 200 баксов?
Но выходят и новые разработки captcha которые труднее взломать. Например есть варианты где показывают несколько картинок и просят выбрать например "картинку на который девушка" или где "яблоко"
Написать такую программу для визуального определения предмета очень сложно, и если такие и есть специалисты то они не станут использовать свои навыки для написания ботов взлома captcha. Пока ещё нет ни одной программы взлома captcha основанной на определении картинок.
Конечно можно методом тыка, но от этого тоже можно защиту найти.
Я не спорю. Это такой забег без конца между программерами по обе стороны баррикад. То одни то другие вырываются вперед. Кроме того что авторы капчи уже намудрили до того что я не в состоянии зарегистрироваться на некоторых сайтах. Капчу не обойти уже и человеку. Или мудрят админы не зная как капчу прикрутить - например попробуйте зарегистрироваться здесь. http://forum.sysfaq.ru/index.php?s=2ed01d9739a537e8e90f1b6f0143c7d8&act=Reg&CODE=00 Ну а обход капчи ЖЖ не стоит больше 100 баксов. Так что видимо это работа программистов ЖЖ а не капчи.
no subject
Date: 2009-10-09 12:57 pm (UTC)no subject
Date: 2009-10-09 12:59 pm (UTC)no subject
Date: 2009-10-09 01:01 pm (UTC)no subject
Date: 2009-10-09 01:02 pm (UTC)no subject
Date: 2009-10-09 01:05 pm (UTC)no subject
Date: 2009-10-09 02:25 pm (UTC)no subject
Date: 2009-10-09 02:37 pm (UTC)no subject
Date: 2009-10-09 11:26 pm (UTC)no subject
Date: 2009-10-09 01:06 pm (UTC)no subject
Date: 2009-10-09 09:36 pm (UTC)Капча это не только облом для спамеров, это ещё и оцифровка многих страниц текста т.ч. нравится, не нравится а двойная польза перевешивает всякие неудобства.
no subject
Date: 2009-10-09 01:07 pm (UTC)no subject
Date: 2009-10-09 01:07 pm (UTC)no subject
Date: 2009-10-09 01:08 pm (UTC)no subject
Date: 2009-10-09 02:27 pm (UTC)no subject
Date: 2009-10-09 11:27 pm (UTC)no subject
Date: 2009-10-09 01:08 pm (UTC)no subject
Date: 2009-10-09 01:11 pm (UTC)no subject
Date: 2009-10-09 01:18 pm (UTC)no subject
Date: 2009-10-09 01:18 pm (UTC)no subject
Date: 2009-10-09 02:09 pm (UTC)no subject
Date: 2009-10-09 02:27 pm (UTC)no subject
Date: 2009-10-09 03:32 pm (UTC)no subject
Date: 2009-10-09 03:06 pm (UTC)no subject
Date: 2009-10-09 04:45 pm (UTC)no subject
Date: 2009-10-09 05:40 pm (UTC)no subject
Date: 2009-10-09 06:55 pm (UTC)no subject
Date: 2009-10-09 08:05 pm (UTC)Особенно когда жешечьку читаешь раз в неделю и когда у твоих нескольких френдов такая фигня то ппц.
есть простой метод борьбы со спамом
Date: 2009-10-09 08:23 pm (UTC)Это мега-супер-программа интеллектуальной фильтрации спама! Она короткая. Очень. Всего одна строчка на PHP:
if(eregi("[a-z]+\.[a-z]+",preg_replace("/p\.s/si","",$TEXT))) { /* ЭТО СПАМ */ }
Физический смысл: если русскоязычный пользователь оставляет комментарий, в котором встречается комбинация из двух латинских букв, разделенных точкой без пробелов, то это однозначно ссылка ("P.S." мы понимаем). А ссылка - это с большой вероятностью спам. Потому что без ссылок спам теряет свой смысл.
Поэтому такие комментарии автоматически становятся невидимы. А я потом приду и посмотрю, что открыть, а что удалить.
Тем, кто писал честные комментарии со ссылками, не влом потерпеть. А спамер обламывается.
Господи, как они тупят, если вручную шлют! Редактируют свой пост и снова пытаются отправить - то выражение "продается на нашем сайте" попробуют написать латиницей, то http отрежут, то www уберут, то тэгами окружат, то BB-тэгами... И все равно робот их посылает нахуй и говорит, что комментарий скрыт. А они не могут понять, как их вычислили ;)))
А роботоспам прекратился со вводом капчи. Я вот думаю убрать ее, капчу. И без нее все прекрасно.
Re: есть простой метод борьбы со спамом
Date: 2009-10-10 02:22 am (UTC)нет - по понятным причинам
Date: 2009-10-10 05:15 pm (UTC)Re: есть простой метод борьбы со спамом
Date: 2009-10-10 05:06 pm (UTC)Тогда ваш "гениальный" фильтр обосрется. И вообше ваш regex извините, хреноват. Если вы уж решли использовать regex то напрягите мозги и напишите получше.
поржал, спасибо
Date: 2009-10-10 05:12 pm (UTC)А что касается regex - напишите эту строчку получше и покажите всем свое мастерство, мы посмеемся. А пиздеть в кулачок и Чебурашка умеет.
Re: поржал, спасибо
Date: 2009-10-10 05:31 pm (UTC)Насчот regex: вы же сами говорите что "в котором встречается комбинация из двух латинских букв, разделенных точкой без пробелов"
а ваш regex ловит все комбинации где один или более латинских букв резделенных точкой.
И потом если уж ловить по такому признаку то домайн любой оканчивается на точку + минимум 2 буквы. ОК, если говорить о домайнах, то домайн может быть и такой: site9.com
в данном случае ваш regex его тоже не поймает.
Хотя-бы исходя из етого regex будет такой:
if(preg_match('/[a-zA-Z0-9]\.[a-zA-Z0-9]{2,}/msi, $text')){
// spam
}
Но ето только самые минимальные улучьшения. Реальнее было-бы ловить линки по признаку того что линк всегда имеет в себе 'http' + иногда 's' + '://'
Re: поржал, спасибо
Date: 2009-10-10 05:42 pm (UTC)Та же проблема у вас и в программировании. Две буквы через точку, это - вида "a.b" или "u.r". Нахуя две буквы городить? Этого АБСОЛЮТНО достаточно для выявления любых линков в тексте русского комментария. За исключением случая "p.s", но вы даже не смогли понять, где в моей строке он обрабатывается. Идите ловите свои http - ну и будете получать спам с именами через www или вообще без префикса, спамеру похуй, его задача - засветить линк в раскрученном журнале чтобы проиндексироваться в поисковике. Вы даже этого не понимаете?
Re: поржал, спасибо
Date: 2009-10-10 05:57 pm (UTC)А если линк без http:// a просто www.site.com то он будет выглядеть линком или просто как техт в бровзере? Конечно если в ЖЖ есть функция автоматически строку типа www.site.com делать линком то можно и это учитывать. Почему-бы не улучшить? Вообще со спамом бороться не так просто как написав одну regex строку.
no subject
Date: 2009-10-09 11:04 pm (UTC)http://jj.ownspace.ru/
no subject
Date: 2009-10-10 12:36 am (UTC)Captcha killer
Date: 2009-10-10 02:20 pm (UTC)Re: Captcha killer
Date: 2009-10-10 06:07 pm (UTC)Написать такую программу для визуального определения предмета очень сложно, и если такие и есть специалисты то они не станут использовать свои навыки для написания ботов взлома captcha. Пока ещё нет ни одной программы взлома captcha основанной на определении картинок.
Конечно можно методом тыка, но от этого тоже можно защиту найти.
Re: Captcha killer
Date: 2009-10-10 06:19 pm (UTC)http://forum.sysfaq.ru/index.php?s=2ed01d9739a537e8e90f1b6f0143c7d8&act=Reg&CODE=00
Ну а обход капчи ЖЖ не стоит больше 100 баксов. Так что видимо это работа программистов ЖЖ а не капчи.
no subject
Date: 2009-10-10 07:41 pm (UTC)Ура!
no subject
Date: 2009-10-12 01:57 pm (UTC)Сегодня меня завалили рекламой парнушки
no subject
Date: 2009-10-12 03:47 pm (UTC)так сложно бывает... ))