Jespers weblog: Als er één schaap over de dam is...

Een aantal dagen geleden analyseerde ik hoe vaak er door de jaren heen op mijn artikelen werd gereageerd. Ik had heel wat data om mee te stoeien en de resultaten waren verbluffend in hun eenvoud. Vandaag ga ik er wat verder op in.

Zo beweerde ik dat het aantal reacties per artikel bij benadering exponentieel was verdeeld. Hopelijk heeft Rein N. het niet gelezen, want anders was hij vast blauw aangelopen. In ieder geval heeft hij me er nog niet in een reactie verbaal van langs gegeven, dus kan ik mezelf alsnog corrigeren. Het aantal reacties is namelijk geometrisch verdeeld. Wat het verschil is? De exponentiële verdeling is continu en de geometrische verdeling is discreet. Een detail, maar wel een belangrijk detail.

Afbeelding: hobby.blogo.nl

Een goed voorbeeld van de geometrische verdeling is het aantal benodigde worpen met een dobbelsteen om eindelijk een keer een 6 te gooien. De "succeskans" p om 6 te gooien zal wel ongeveer 1/6 zijn, dus is de kans om geen 6 te gooien 5/6 (q). In formulevorm is de kans om in de n-de worp voor het eerst 6 te gooien gelijk aan pq^(n-1). Het gemiddelde (verwachte) aantal worpen is 1/p = 6. Het duurt dus gemiddeld 6 beurten voordat je 6 gooit. Niet heel verrassend natuurlijk. Interessanter is dat de verwachte waarde 6 is zolang je nog geen 6 hebt gegooid, de zogenaamde geheugenloosheid. Of je nou één of al honderd dobbelstenen hebt geworpen, je bent nog steeds gemiddeld zes worpen van succes verwijderd.

Het grappige is dat het aantal reacties per artikel goed is te vergelijken met het gedrag van een dobbelsteen. Het aantal reacties op een artikel is ook te zien als een reeks die op een willekeurig moment doorbroken kan worden. Zolang er een 5 of lager wordt gegooid, komt er een nieuwe reactie. Bij een 6 blijft het stil. De kans op n reacties is nu gelijk aan pq^n en het gemiddelde aantal reacties (de verwachting) is gelijk aan q/p = (1-p)/p = 1/p-1 (de laatste "worp" telt immers niet mee). In het dobbelsteenvoorbeeld is de verwachting nu dus 5.

In het reactievoorbeeld blijkt de kans op een 6 verbazingwekkend constant te zijn. Het maakt amper uit of een artikel nou 1, 10 of 20 reacties heeft, de kans op een nieuwe reactie blijft ongeveer hetzelfde:

In het tweede weblogjaar was de kans op een nieuwe reactie ongeveer 86%.

Doordat er natuurlijk maar weinig artikelen met heel veel reacties zijn, begint de grafiek vanaf zo'n 20 reacties hevig te fluctueren. Tot die tijd schommelt de "succeskans" ergens tussen de 0,1 en 0,2, zonder dat er een duidelijk patroon in zit. De succeskans lijkt dus constant. Geen interactie dus? Misschien wel. Het blijkt dat de kans op geen reacties in alle jaren hoger is dan de geometrische verdeling voorspelt. Daar zijn vele verklaringen voor te verzinnen en interactie tussen lezers is er een van. Het effect was in alle jaren aanwezig, maar niet altijd even groot:

De reactiekans was in alle jaren groter bij artikelen met reacties.

In sommige jaren (jaar 2 en 4) stelde het weinig voor, maar in andere jaren maakte het wel een substantieel verschil. Zo blijkt dat de Blogspot-jaren het niet eens zo heel slecht doen bij artikelen met reacties. Het verwachte aantal reacties in weblogjaar 6 en 7 is groter dan 4 voor artikelen met minimaal één reactie, wat in de buurt komt van de bedragen in weblogjaar 1 en 3. Het verschil zit echter vooral in het kleine percentage van de artikelen waar ook echt op gereageerd wordt: 58% in jaar 6 en slechts 37% in jaar 7. Daar kan dus nog veel winst gepakt worden.

In dat opzicht ben ik dan ook ver verwijderd van de cijfers in het vierde weblogjaar. Reactiekansen rond de 90% zouden me nu enorm doen watertanden, maar misschien moet ik me maar tevredenstellen met statistieken die op veel interactie duiden. Kennelijk geldt nu dat als er één schaap over de dam is, er meer volgen. Dat is in het verleden wel anders geweest, getuige de nagenoeg geometrische verdelingen, zoals in het tweede jaar:

Zelfs in het tweede weblogjaar waren er relatief veel artikelen zonder reacties.

Ondertussen probeer ik de lezer, als-ie nog niet is afgehaakt vanwege de wiskundige formules, tegemoet te komen door hem (of haar) het reageren makkelijker te maken, maar mijn middelen daartoe zijn beperkt. Als alternatief voor het geven van een reactie heb ik een soort vind-ik-leuk-knop toegevoegd. Hopelijk slaat het aan, want leuker dan dit kan ik het ook niet maken...