honey wiki – collect the spam

Миналата седмица приютих един проект, започнат от Григор Гачев, но поради високо натоварване вече не може да го приютява. Става въпрос за honeywiki.zavinagi.org.

Домейна от около седмица сочи към моя виртуална машина. Като първо сложих съвсем стандартно само mysql и php. Няколко часа след насочването на домейна се засили трафик към сървъра. Съответно всичко се позабави – сложиш memcached с 1Г заделена памет /нещата заспаха поне от гледна точка на четенето/. От време на време има големи пикове, но за сега не са проблем.

Равносметката за първата седмица: почти 7000 бота са ходили по wiki’то, от тях малко над 4 са писали в него. Тези ботове са публикували над 130000 “неща”. Публикуваната информация е доста разнообразна, но ми направи впечатление, че линковете в нея не са към лоши сайтове. В повечето случаи сочат към потребителски профили в социални мрежи, форуми, блогове и подобни. Което прави доста трудно използването на линковете за “директно” блокиране на “гадни” сайтове.

От около година в един от големите проекти събираме лоши източници на трафик, преди 3 месеца закупих два cpanel’а (голямо мерси на колегите от superhosting) и през тези панели се събира  информация за гадни типове. honeywiki допълни лошите момчета. След нова година, когато остане време ще драсна 2-3 скрипта, за да агрегирам тази информация. Плана е да я обновявам веднъж дневно и който желае да я ползва БЕЗПЛАТНО :)

2 thoughts on “honey wiki – collect the spam”

  1. Браво! И благодаря от сърце, че пое проекта в момент, в който вече не можех да се справя с него.

Leave a Reply

Your email address will not be published. Required fields are marked *