“Miscellanées”

blogosphère | etude du blogue

Endogamie comparée

La semaine dernière, je m’intéressais au phénomène de l’endogamie propre aux solutions de blogues, et je citais à titre d’exemple la plateforme 20six.fr qui, intuitivement, me paraissait très endogame. (Dans un commentaire, Guybrush nous a appris ce qui explique en partie ce phénomène propre à 20six.)

Je m’étais dit qu’il serait intéressant de mener l’étude sur un plus large échantillon, et d’effectuer un comparatif de la propension moyenne à l’endogamie selon les principales plateformes françaises. C’est ce que je vous propose aujourd’hui.

L’échantillon pour le calcul de l’endogamie de chaque plateforme est constitué de 20 blogues disposant d’une blogoliste, sélectionnés au hasard (généralement dans la liste des blogues dernièrement mis à jour), additionné d’autant de blogues sans blogoliste qu’il a fallu parcourir pour atteindre les 20 blogues avec blogosliste.

Seuls les liens vers des blogues sont comptabilisés, les autres sites éventuellement présents dans la blogoliste sont exclus.

Avec
blogoliste
Taille moy.
blogoliste
Liens
endogames
Liens
exogames
Degré
d’endogamie
20six.fr 83,3 % 22,4 392 47 89,3 %
HautEtFort 37,7 % 6,1 73 50 59,3 %
Joueb.com 47,6 % 17,6 204 149 57,8 %
U-Blog 46,5 % 14,5 149 142 51,2 %
CanalBlog 52,6 % 6,2 54 71 43,2 %

On remarquera que si un blogue 20six a presque toujours une blogoliste, c’est loin d’être le cas chez HautEtFort (seulement 37,7 %). Les autres plateformes sont assez comparables, puisque environ un blogue sur deux possède une blogoliste. Les blogues 20six se distinguent également par la longueur record de leurs blogolistes. À l’opposé, c’est chez HautEtFort et Canablog que l’ont rencontre les blogolistes les plus succintes. La forte endogamie propre à 20six se trouve ici confirmée (près de 9 liens sur 10). Les autres solutions sont assez comparables, sauf peut-être CanalBlog, qui, si il crée fort peu de liens (moyenne de 6 liens par blogue), est majoritairement exogame.

Échantillons utilisés

Échantillon 20six.fr (24 blogues) : fracassemag, traverse_moi_l_esprit, illninogirl, Melmji, Linoa, auroress1, auroress1, Bibi_Angel, Al_Mistral, ombrelune, Bigfly, Tartine, Pimprenelle, ClairObscur, lohan14, juce, Bonan_Malan, Lailis, brody, Grebrepuk, tiamate, walbyx, cclere, blogduncon.

Échantillon HautEtFort (53 blogues) : football, palindrome, citizensnews, Coldfingers, coupleparisien, les-jumelles, roses%20et%20poireaux, paostation, chazygirl, superdrague, thinkdifferent, nicegirlcrew, manutara, que-moi, precision, juppepourlafrance, guiadeparis, anchorannews, millyrock, cloe, penseesabsurdes, superflu, boots, oxyde, bluedream, chinoiseriz, madeline, narcisse, lesdivagationsdarkell, tibolano, koalacrosshere, journalsansprozac, anne-sophie, juliette-sans-romeo, chocolat, elsa2907, detoutetderien, legalize-it, ah-lamour, sablier, neuneuland, mavie, kelly, babibu, alinet, olivechocolat, phaistos, bigorno, Lupin, matleboss, erreur666, utO, rexappeal.

Échantillon Joueb.com (42 blogues) [les blocs "ailleurs sur Joueb.com" n’ont pas été comptabilisés] : happy, nye, ptitetsu, watson, avalon, mouah, lesmusesdunet, fouduroi, emois, dodie-forever, supercollegue, dialoguesocial, aspirant-artiste, sahara, endehors, sophie05, gwentyrael, lamuselivre, tropdebruit, gabrielney, lenaig, docbrown, mifmif, els, climaginaire, barjacitudes, margotte, tchenrezi, ultraball, valaxaur, patalapin, she, morphee, corpus, c-c, optimistik, meilah, outilsfroids, nowane, comateen4, zelia, lilinette.

Échantillon U-Blog (43 blogues) : lalili, cyberwarrior16, IndulgenceEtDerision, PourquoiResister, lecom21, kikalove, Atherakh, paragesindociles, DoubleJe42, autrementdit, galaxys, ScriptaManent, VilifeRexie1, desertisland, fleurbleue, blablaleretour, Fulcanelli, nazdaq, nalys, nabiloo, auroraweblog, gazobumeu, KSlywind, fanfreluche, ludecrit, theFlyingRabbitAdventures, demainleparadis, andrei, jtekiffe, berlol, EnAttendantGodot, Ficelle, putch, lalune, schwobb, intrigay, dentelliere, eolas, Matys, macmoorechelsea, unconscious, oeilduchat, sprengfield.

Échantillon CanalBlog (38 blogues) : lolo1403, inaetmoi, barbudo, avous, angiem44, eyckblog, elea79, pipers6, maringouin, jenigold, lefneublog, petitguigui, angelic, lamauvaiseherbe, charmeds6, maaya, simpledazelife, moietmaradio, meguiche, capucine, ybryey, cafenoir, 2ndclasscitizen, yaoifanboy, shushushu, striptease, fanelia7, phinet, foudebassan, scrapbook, blog0lafolle, lithium, lalow, gotikalantika, princessa, amourimpossible, anisia, rayben.

1. Le 22 juillet 2004,
Felicitee

Je trouve très intéressant cette étude, mais l’échantillonnage est vraiment très petit (trop ?)pour avoir une vraie validité.

2. Le 22 juillet 2004,
Stephane

Tu as fait cela à la main ? Ca ne devrait pas être compliqué d’envoyer une petite araignée pour faire le boulot si tu veux un échantillon plus gros.

Sinon ça serait intérèssant d’avoir le médian plutôt que la moyenne, afin d’éviter d’avoir des nombres faussés pour Blogspot parce que tu as choisi JLR au hasard.

3. Le 22 juillet 2004,
Laurent

Stéphane : c’est obligé de le faire à la main. Avec les gens qui ont bricolé leurs templates par défaut, parfois difficile de retrouver la blogoliste. Sans compter ensuite la reconnaissance d’un lien vers un blogue d’un autre. Felicitee : ceci explique cela. Je ne réclame pas une vraie validité, c’est juste une tendance par plateforme.

4. Le 22 juillet 2004,
Laurent

Condidérez ça pour un sondage, par une étude exhaustive. Intuitivement, je me dis que mon taux d’erreur doit être assez faible.

5. Le 23 juillet 2004,
JP

Mon pifomètre d’ex-statisticien t’accorde une fourchette d’erreur de l’ordre de + ou - 3 points.

Les échantillons ne sont pas trop petits, donc. Par contre, comment les as tu recrutés? Tu as suivi les liens des blogolistes ?

6. Le 23 juillet 2004,
Laurent

Pour toutes les plateformes (sauf Haut et Fort), j’ai pris les derniers blogues ayant publié un billet (ici par exemple, ou encore ) , en sautant cependant les blogues vides, tout nouveaux, ou avec juste des billets de test. Pour Haut et Fort, la liste des mises à jour en page d’accueil ne semblait pas se rafraîchir correctement et comme j’avais besoin de beaucoup de blogues (+ de 50, car les blogolistes sont rares chez H&F), j’ai pioché au hasard dans l’annuaire et dans les pages d’une recherche Google. Donc hasard total pour tout le monde. La seule critique que l’ont peut faire de la technique d’échantillonnage serait s’il y avait une corrélation entre l’heure de publication et le genre de blogue (du style, les blogues plein de liens publierait plus en 23 h et minuit alors que mon échantillon date de 18 h 30), mais je n’y croie pas trop ;-) Donc pour répondre à ta question, je n’ai pas suivi de liens de blogolistes.

7. Le 23 juillet 2004,
JP

OOOps J’avais raté le paragraphe clé, avant le tableau Bon, ca ramène la fourchette, au pire, à + ou - 7 points, et très vraisemblablement, vers + ou - 5 points.

8. Le 23 juillet 2004,
Laurent

De mon expérience de blogueur et de mon intuition, je peux aussi dire empiriquement que la fourchette d’imprécision dépend de la plateforme, car il y a des plateformes plus homogènes que d’autres en genre de blogues. Joueb.com me semble assez homogène, alors que HautEtFort, beaucoup moins, par exemple.

9. Le 23 juillet 2004,
JP
    • 7 points, c’est pour une plateforme pas du tout homogène, dont chaque blog serait soit totalement endogame, soit totalement exogame.
10. Le 23 juillet 2004,
Stephane

Je pinaille, mais ton échantillon n’a rien d’un “hasard total”. Les blogueurs les plus actifs sont sur-représentés, et les blogueurs du dimanche complètement absents puisque tu as fait ton test un jeudi. Un blogueur qui poste 20 fois par jour avait 20 fois plus de chance de se faire selectionner qu’un blogueur qui poste 1 fois par jour. Tu aurais fais ton test avec les BlogSpot francophones, tu aurais eu JLR dedans.

Stéphane, grand amateur d’échantillons

11. Le 23 juillet 2004,
Laurent

Ton objection me semble tout à fait pertinente Stéphane. Mais je ne sais pas si cela aurait beaucoup d’influence sur les résultats. C’est possible d’avoir un fichier de toutes les URL Joueb pour y faire une sélection aléatoire ?

Il faut éliminer les valeurs extrêmes dans les petits échantillons, donc JLR par exemple pour Blogspot, ou alors disposer d’un échantillon beaucoup plus large pour lisser l’effet.

12. Le 23 juillet 2004,
be-rewt

Voilà, c’est dit, Laurent a affirmé qu’il fallait éliminer JLR. ;)

13. Le 23 juillet 2004,
Stephane

Je peux te proposer la liste des jouebs actifs : http://joueb.com/texts/active_sites.shtml C’est ce qu’il y a de mieux pour faire ce genre d’étude. Ou alors tu prends la liste de weblogues.com sur une semaine.

14. Le 23 juillet 2004,
Laurent

Merci Biz ! Ta liste est parfaite (si tout le monde proposait ça…).

15. Le 28 juillet 2004,
xoofoo

Mouais… Même si les échantillons sont petits, je pense qu’avoir des tailles d’échantillon équivalentes aurait été judicieux (plutot que d’avoir des tailles du simple au double)… Même si ça n’engage que moi :-)

16. Le 28 juillet 2004,
Laurent

Les échantillons sont identiques (20 blogues AVEC blogoliste).

17. Le 28 juillet 2004,
flipflap

en tout cas, le blog de Virgine Despentes est totalement endogame

18. Le 2 août 2004,
Lupin

En tant que Lupin de Hautetfort, je me permet une petite remarque qui pourrait changer les données. Je lis de blogs depuis plus d’un an, ayant commencé avec le Navire d’avant Embruns, mais je n’ai mis dans mes liens que les blogs dont je me sens l’”égale”. Les autres, ceux dont je m’inspire et qui me font découvrir chaque jour un peu plus, je les garde dans mes favoris.

19. Le 2 août 2004,
Al Mistral

Pour être tombé par hasard et ça fait super méga mal…

En lançant une bête recherche google sur mon pseudo, je tombe sur des sites dans lesquels je suis référencé. Car j’y ai soit laissé mon empreinte, soit que j’y ai souscrit à un quelconque service. Mais là, pauvre de moi…

Que vois-je donc pas sous l’impression rétinienne de la rayonnance de mon tube cathodic pratiquant, passant par mon iris, marron de surcroît et frappant en plein ma cornée mal encornée (lunette style… bon ça va j’suis hypermétrope.. pfff !!!)

Je lis donc mon pseudo sur un site que je ne connais ni d’Eve ni d’Adam, ni des lèvres ni des dents. Ma curiosité n’en faisant qu’un tour accompagnée par mon sang qui le faisait déjà très bien lui aussi tout seul dans son propre coté, le lâche..

Je clic sur le lien et ho stupeur et damnation (heu… non damned je suis fait comme un rat.. non plus ! heuuu… bon comme le printemps passons !) je tombe sur un blog sérieux m’ayant pris en terme de référence de son échantillonnage pour une étude assez complexe sur le calcul de l’endogamie des plateformes bloguiennes ou un truc dans le genre…

Je me suis senti assez flatté et profite par la même de laisser mon empreinte chez ce monsieur sans manqué de le référencé dans mes liens (puisque c’est aussi un peu l’étude de son sujet) afin d’en savoir plus sur la notion d’endogamie des différentes plateformes. Mais aussi de vous faire partager ma surprise et ce jeune homme aux différents contacts qui cliquerons sur le lien inséré sur mon blog.

Au plaisir de vous relire Al. M

20. Le 3 août 2004,
Al_Mistral

Et au fait en REpassant pour te REmercier d’être à ton tour REpassé sur mon blog, et au vu de tes recherches, je voudrai te soumettre une question

Quel serait les effets de la montée des “blogs en bourse” par rapport à l’impact, déjà important, de l’envie de se rendre plus “endogamique” grâce à une potentialité de reconnaissance plus large ? serions nous alors nos propres produits de création que l’on vendrait au plus offrant… reproduisant alors une contre valeur monaitaire. A tant de point gagné ces options vous serons offerte… et bien sur grâce à ces dernières vous en gagnerez plus… c’est évident! Adieu France Telecom… j’ai gagné un an d’abonnement grâce à mon blog… et vous qui me lisez je vous le dit… le blog marketing a de l’avenir…

bon plus sérieusement. J’avais lancé pour tout avouer ce soir la recherche google pour savoir où j’étais référencé car c’est une amie m’avait averti que j’étais sur blogshares : ( http ) bon je suis pas super fort en anglais donc je rame un peu et j’ai de ce fait pas tout piger les regles du jeu, si ça en est un ! tu en voulais du boulot ??? non !!! ah bon ????

21. Le 3 août 2004,
sagesse

aucunement vexée par la mini-étude pas forcément viable statistiquement, mais ça fait un ti peu de bruit déjà sur 20six… il se trouve aussi, qu’on arrive sur 20six parce que c’est celui que l’entourage conseille (et je ne parle pas là de communautés d’ados), et qu’on s’y installe un peu par hasard… question de pub? Je n’avais jamais entendu parler des autres, sauf sur 20six…

22. Le 9 août 2004,
Blaise

Un autre biais a prendre en compte: la taille de la platforme. Si une platforme A heberge un millier de blog, elle sera probablement environ 10 fois plus liee qu’une plateforme B qui n’en heberge qu’une centaine. Si A et B sont les deux seules plateformes de la blogospheres, on peut s’attendre a ce que A soit 90% endogame, et B 10%, selon ta mesure statistique

23. Le 10 août 2004,
stroppycow

Je ne connais pas les autres plateformes mais 20six encourage des comportements endogenes (ajout facile des bloggers 20six a la blogliste, une fois logged in pas besoins de remettre ces details quand on veux faire des commentaires d’un blog a l’autre et les bonbons par example).

24. Le 29 août 2004,
rerebob

Si 20six est si endogame c’est peut-être a cause du systeme mise au point par 20six qui permet d’ajouter un autre blog (de 20six) a ses préférée d’un simple clique.

25. Le 6 septembre 2004,
Grebrepuk

Tout pareil que pour Al Mistral. Parti pour me googeliser, je tombe ici, blog que je connais de (re)nom. Je cherche tous les jours à être moins endogame, mais 20six pousse loin le principe de communauté qui fait que peu de bloggeurs cherchent à en sortir (de la plateforme 20six)

26. Le 18 septembre 2004,
Houillemolle

Les Skyblog de Skyrock me semblent aussi marqués par cela. Mais là les liens se font par le bouche à oreille, une même classe de BTS par exemple. En commançant par là : Finch le Curieux

27. Le 21 septembre 2007,
Sub’s

• Un bon vieux sujet comme j’aime les ressortir ! Que crois qu’au jour d’aujourd’hui, 20six finirai bien loin en bas de classement… sans parler des problèmes propres à une version française qui survit (encore) on ne sait comment. Et si on refaisais le point ? • Je reprends une phrase d’AL_Mistral (qui n’est plus sur 20six.fr depuis fort longtemps comme beaucoup d’autres) [“Quel serait les effets de la montée des “blogs en bourse…” ] Moi je sais ! Et certains valent une petite fortune ^^’) Une seule part d’Embruns.net le 20/07/07 vaut 52.155,97B$ !!! C’est énorme !!! •

Blah ?