search-engines

I HATE VOILA BOT

I have been batteling the damm voila bot before and despite that it is blocked in my robots.txt, it kept hammering my small site.

User-Agent: VoilaBot
Disallow: *
Bad voila bot! Bad!! To give you an impression, of the last 2000 hits, 1753 were from voilabot.
I already blocked the damm bot but they have a new source IP address that was able to get to my site, not anymore!
#voilabot
iptables -I INPUT -s 193.252.118.188 -j DROP
iptables -I INPUT -s 193.252.118.189 -j DROP
iptables -I INPUT -s 193.252.148.101 -j DROP
iptables -I INPUT -s 193.252.148.208 -j DROP
iptables -I INPUT -s 193.252.148.209 -j DROP
iptables -I INPUT -s 193.252.118.101 -j DROP
My site went down and I needed to repair the database as well:
 myisamchk /var/lib/mysql/willy/cache.MYI -o
The willy Dobbe team is sorry for the downtime...

Voilabot bad dog!

As you might have seen this sight is very slow the last day or so or even inaccessable. First of all, tere are lots of new users out there who visit this site, to those I say welcome! Create an account, post comments, click banners if you like what you see and come back!

The second reason why willy is slowish, is due to Voilabot. This stupid bot is hammering my site. I already dropped some IP blocks from the bad bot, but there are to many blocks to block. And then I blocked them in my robots.txt

[root@tug ~]# cat /var/www/html/robots.txt
User-Agent: VoilaBot
Disallow: *
User-agent: *
Crawl-Delay: 10
Disallow: /myblog/comment/reply
Disallow: /myblog/node/add

And the stupid bot is reading (OFTEN!) this robots.txt file.

[root@tug ~]# 193.252.148.208 - - [19/Apr/2006:20:13:50 +0200] "GET /robots.txt HTTP/1.1" 200 124 "-" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voila.com/)"
[root@tug ~]# 193.252.148.208 - - [19/Apr/2006:20:13:51 +0200] "GET /myblog/archive/2004/12/taxonomy/term/10 HTTP/1.1" 200 - "-" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voila.com/)"
[root@tug ~]# 193.252.148.209 - - [19/Apr/2006:20:13:56 +0200] "GET /robots.txt HTTP/1.1" 200 124 "-" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voila.com/)"
It just chooses to ignore it. Bad bot! Go away you smelly french dog! Shooeee!

Cool Flickr Related Tag Browser

This Flickr Realted Tag Browser in flash has to be one of the coolest uses of the Flickr API. Type a tag, scroll through the gallary, zoom out (mouse out) to see the related tags. Way cool and a great way to waste time. Reminds me of surfing back in the nineties, clicking through useless pages. Try it and let me know what you think of it!

Sitedeals15 released

Stuurfout verhaalt over hoe je met een absurde titel (Sitedeals15 released) nummer 1 kan worden bij Google. Pfftt. Big deal. Ik heb nummer 1 gestaan met betere woorden ("raar kapsel", "pijpen"). Dus sematische HTML (nice theme) en Clean URL's (dank aan Drupal) en mijn pagerank (5 ipv 4 als stuurfout) gooi ik in de strijd. Ik zeg, binnen een maand sta ik nummer 1.

Het was nog nooit zo gemakkelijk om een topranking te behalen in Google. De Belgische startpagina Voor U organiseert samen met het webmaster forum Site Deals een zogenaamde SEO Contest. De bedoeling van deze contest is dat je met jouw site een zo hoog mogelijke behaalt bij het zoeken op de woorden ‘Sitedeals15 released‘. Voor nog geen 80 euri heeft Voor U een topranking weten te behalen in Google, zonder het inhuren van de marketingboys van bijvoorbeeld Checkit. Knap staaltje marketing van die Belgen.



Nu we toch al reclame gemaakt hebben voor het webmaster forum Site Deals en startpagina Voor U kunnen net zo goed meedingen voor die Ipod Shuffle. Aangezien de GoogleBot regelmatig bij ons op de koffie komt moet die nummer 1 positie geen probleem zijn.

Googlebomb in progress.

Torrentspy 2.0

This is a weird and hip, torrentspy.com, a torrent search engine that has digg.com functionality, RSS feeds, blogsearches and even a plugin for firefox. "It's hip to be 2.0"

XML feed