Google Code Search [via Kottke]. Fucking. Crap. Ugly. Stupid. Sucks. Glazman. Etc.
Hit-Parade, septembre 2006 :
[Pour réf. août.]
Meilleurs apporteurs de trafic (hors moteurs de recherche et agrégateurs en ligne) :
Top des recherches moteurs :
Top des robots :
Meilleur jour de la semaine : lundi.
Meilleur jour du mois : 25 septembre 2006 [7832].
Meilleur jour de l’année : 25 septembre 2006 [7832]. Précédent, 22 février 2006 [7643].
wow. montée à la 4ème place à la faveur de “l’affaire mémoire vive” ? Impressionnant. Il faut qu’on relance une polémique sur octobre, je dois pouvoir monter sur le podium. Je vais passer un coup de fil à Loïc pour qu’il organise quelque chose.
Ceci-dit, vaut-il mieux avoir du succès sur fond de polémique blogueuse, ou le jour où deux blogpotaches vous exhibent quasi nu à un pince-fesse ministériel ?
Et moi je suis ta plus grande “fournisseure” de photos de chats. Ça vaut une mention.
Je monte de deux places sans bloguer une ligne, mon vieux blog a pris une vie autonome ! :D
Pour Inktomi, tu n’es pas le seul apparemment si on cherche un peu sur le Web. Les robots qui ont un mauvais comportement il faut les exclure.
Le gros problème d’Inktomi, c’est qu’il y a plusieurs robots qui viennent chercher les même contenus et qui reviennent plusieurs fois dans la même journée.
Pour le 11 octobre 2006, juste sur La Grange, il y a eu 99 passages de Inktomi, avec 17 robots différents.
$ grep inktomi 11-lagrange-access_log | awk ’{print $1}’ | sort | uniq -c
21 fj301028.inktomisearch.com
17 fj5012.inktomisearch.com
1 lj611005.inktomisearch.com
14 lj611408.inktomisearch.com
3 lj611535.inktomisearch.com
1 lj611538.inktomisearch.com
7 lj611539.inktomisearch.com
2 lj611649.inktomisearch.com
1 lj910055.inktomisearch.com
3 lj910062.inktomisearch.com
1 lj910079.inktomisearch.com
1 lj910100.inktomisearch.com
1 lj910186.inktomisearch.com
14 lm502041.inktomisearch.com
7 lm502042.inktomisearch.com
4 si1002.inktomisearch.com
1 si1003.inktomisearch.com
Heureusement, ils respectent le robots.txt ce qui n’est pas le cas du mauvais robot de Technorati
Dans cette même journée, il y a eu 132 robots différents demandant le robots.txt
grep robots.txt 11-lagrange-access_log | awk ’{print $1, $14, $15, $16}’ | sort | uniq -c | wc -l 132
je vais pas poster la liste ici, mon commentaire va partir en spam :p
Technorati ne sont pas les seuls bien sûr. Dans les mauvais garçons, il y a juste pour la journée du 11 octobre toujours et juste sur la grange.
44 Rojo, 14 Exabot (Exalead participant au projet concurrent européen de moteurs), 25 Tailrank, 24 Trayce, 10 Plazoo
plus quelques autres bien sûr
“embruns”, journal de bord | fins produits hypertextuels depuis 1996 | valid. | © 2011 laurent gloaguen.
1. Xavier le 11 octobre 2006
Je suis sûr que Daniel appréciera à sa juste valeur le fait d’être mis au même niveau que ces autres mots ;)
2. Laurent le 11 octobre 2006
Je suis sûr que Daniel a le sens de l’humour…
3. koztjs le 11 octobre 2006
C’est qui, Daniel ?
4. Stéphane Z. le 11 octobre 2006
À quand le Google God Search ?
5. Xavier le 11 octobre 2006
@Laurent : crois bien que j’en suis également convaincu.
6. palpatine le 11 octobre 2006
Tu oublies celui que l’on utilise tout le temps (moi en premier, j’ai des comm’ assez farfelus aussi :p ) : dumb.
Sinon, c’est vraiment trop drôle, le bashing contre les technos proprios (compilos et OS en tête), c’est du bonheur absolu :p
99: require Win32; # are we running under dumb OS? $ATTR{CAN_FLOCK} = Win32::IsWin95() ? 0 : 1;
7. Brad-Pitt Deuchfalh le 11 octobre 2006
ça marche aussi en français
8. Gab le 11 octobre 2006
Et les bouts de code qui ne devraient pas être là:
q=not+belong+here
9. Daniel Glazman le 12 octobre 2006
warf.
10. Pascale le 12 octobre 2006
Et “canard” ça donne quoi ? (sans <head> bien sûr ;) )