Minciuni, minciuni sfruntate si statistici.
Thursday, 23 April, Year 1 d.Tr. | Author: Mircea Popescu
Un oarecare Samuel Clemens, un individ de altfel fara ocupatie stabila ori domiciliu cunoscut, s-ar fi exprimat ca exista pe lume trei feluri de minciuni : minciuni, minciuni sfruntate si statistici.
Luati de exemplu Alexa, o companie de minciuni sfruntate si statistici 2.0 (o extensie naturala a portofoliului Amazon de minciuni simple).
Incercuit cu rosu aveti efectul ploilor de sfarsit de martie, calde, de primavara, pe blogorul roditor (2.0). Este ca se cunoaste ?
Category: Meta psihoza
Thursday, 23 April 2009
statisticile alexa sunt bazate pe un eșantion care nu se prea supune regulilor: tu ți-ai instala un toolbar Alexa, despre care știi clar că trimite statistici cu tot ce vizitezi? Dacă nu știi sau, mai rău, nici nu înțelegi ce e aia, intri la statistica lor.
chiar să nu ai nimic de ascuns, tot te gândești de două-trei ori înainte. Și chiar dacă instalezi, probabil vei șterge cookies suficient de des ca să pari vizitator unic.
Cititorii lui Seth Godin cred ca nu si-ar pune Alexa toolbar, de exemplu, si cred ca si o parte dintre cei ai lui Zoso (nu par prea isteti, dupa nivelul comentariilor, dar par sa aiba ceva cunostinte de web)
Thursday, 23 April 2009
Bun dar ideea e, ce focu s-o putut intampla, fix in martie 22 pe la pranz, de-or explodat graficele ? Daca observi ca-i scara logaritmica, si incerci sa interpretezi, deduci ca traficul oamenilor astora o crescut macar de 8 ori asa, peste noapte.
Ce-o fost, Caritas in ziua aia ?
Thursday, 23 April 2009
Probabil au facut update ceva la algoritm si poate nu e sincronizat cu ce era inainte.
N-ai cum sa compari pe shomoney, sethgodin si zoso. Targeturile difera destul de mult. Cel mai adesea cine are instalat alexa toolbar e marketer, webmaster sau ceva similar. De aceea siteuri nisate tangetiale cu marketingul online cu trafic mic (chiar si cateva sute de vizitatori pe zi) pot avea un alexa rank destul de bun, pentru ca sutele alea de vizitatori au toti instalat alexa toolbar.
Thursday, 23 April 2009
Eu nu-i compar intre ei, din contra, eu arat cum trei site-uri ce n-au nici in clin nici in maneca au variat aberant si simultan.
Thursday, 23 April 2009
in martie au schimbat sistemul. n-am gasit la ei pe blog decat asta http://awis.blogspot.com/2009/03/pardon-our-dust.html
ai fi aflat asta daca foloseai google inainte sa publici. :)
Thursday, 23 April 2009
E bine ca esti un om foarte informat, ca urmaresti lucrurile in profunzime si le intelegi in adancime.
Pentru astia mai lenti la cap (ca de exemplu, eu), citeaza din link-ul ala, paragraful unde se spune,
"Am decis ca traficul unor site-uri era de fapt de 10-20x mai mare decat fusese raportat anterior, si am facut aceasta modificare retroactiv in liste dar nu si in grafice.
Aceste modificari nu se aplica pentru toate site-urile, si aplicarea lor nu face o minciuna nici din statisticile prezentate de noi pana acum, nici din statisticile prezentate de noi de acum inainte, pentru ca noi credem cu tarie ca statistica are capacitatea de a schimba trecutul, prezentul si viitorul, in mod contradictoriu si totusi credibil."
Thursday, 23 April 2009
Un hint de pe Wikipedia (http://en.wikipedia.org/wiki/Alexa_Internet#Redesign_and_new_statistics)
"On March 31, 2009 Alexa.com got a complete redesign and new metrics including: Pageviews per User, Bounce Rate, and Time on Site.[20] In the following weeks they added new features including Demographics, Clickstream and Search Traffic stats."
Thursday, 23 April 2009
Bun, dar vezi tu diferenta intre a adauga noi masuratori, si-a da rezultate cu varianta de doua cifre la masuratorile vechi ?
Thursday, 23 April 2009
Daca te uiti la categoria "Page views" la fiecare site o sa vezi ca la trafic nu este nimic caresa para la prima vedere anormal, ceea ce intareste ipoteza unei schimbari de algoritm de ranking. Plus, crezi ca "new metrics", "complete redesign", crezi ca asta se rezuma la simplul fapt de a adauga noi metrici si a infrumuseta site-ul? E un simplu text de pe wikipedia care rezuma in cateva cuvinte o munca de cateva luni probabil si pana nu ai CHANGELOG-ul complet nu poti sa excluzi si un update la algoritmul de calculare al traffic rank-ului. Corelarea datii modificarilor cu saltul in traffic rank ramane doar o corelare si u cauzalitate, de acord, dar deocamdata ramane corelarea cea mai evidenta.
Thursday, 23 April 2009
Uite, tu ai studiat stiinte, intelegi destule despre experimente, daca maine astia de la Hubble incep sa raporteze toate distantele masurate ca fiind un ordin de marime diferite fata de rapoartele de ieri, nu zici ca-s defecti ?
Daca ai un voltmetru, care masoara niste circuite, si da niste valori, si iti cumperi o editie imbunatatita si adaugita, adica un multimetru, care la voltaj masoara de zece ori valorile de ieri, nu zici ca-i defect ?
Sunt defecti, ce mai.
Thursday, 23 April 2009
Eu nu zic ca e stricat, zic ca a fost un update, sau un bug. Ca e stricat - fata de cum era calculat inainte - probabil ca e stricat, putin ma intereseaza. Poate e imbunatatit, cine stie. Treaba e ca rankul Alexa nu e o unitate de masura universala, e exact ceea ce Alexa vrea sa zica ca este, la fel ca si rankul Google si trebuie luat in consecinta. Daca il gasesti ca sursa de crestere de trafic atunci il iei in considerare si incerci sa ti-l imbunatatesi, daca nu, atunci te doare undeva de el.
Nu e chestie de minciuna sau adevar, e doar un fel subiectiv de a calcula un rank a carui metoda pare sa se fi schimbat si care intelectual ar fi interesant de studiat daca m-ar preocupa mai mult decat ca simpla observatie.
Thursday, 23 April 2009
Deci stai omule. Un numar poate fi o inventie sau o masura. Altceva nu poate sa fie, ori una, ori alta.
Teza postului e ca ceea ce tipareste Alexa e o inventie nu o masura.
Suntem atunci de fapt de acord ?
Thursday, 23 April 2009
Page rank-ul publicat de Alexa nu e o masura, e un calcul bazat pe alte masuri directe printr-ul algoritm propriu. Daca vrei sa o numesti inventie cred ca se incadreaza in aceasta categorie. O inventie calculabila dupa algoritmul lor care atata timp cat nu are "random" in el e si reproductibila. In masura in care inventie intra in definitia pe care o dau atunci suntem de acord. Doar ca de aici pana la minciuna vs. adevar e cale lunga. Chiar nu vad ce are de-a face una cu alta.
Thursday, 23 April 2009
Pai tocmai demonstra ca nu-i nici reproductibila, si mai grav, ca ei nici macar nu inteleg ca ar fi de asteptat sa fie!
Oamenii astia tiparesc un grafic, in care masurile zboara in toate partile, si asta nu deranjeaza pe nimeni.
Cum adica, e cale lunga ? Arata-mi ce-i lipseste situatiei ca sa fie minciuna, ca nu ma prind.
Thursday, 23 April 2009
Subiectul incepe sa capete mai multa importanta decat merita. Daca pre-Martie 31 aveau un algoritm si post-Martie altul, atunci imi imaginez ca in ambele cazuri calculul ranking-ului e reproductibil. Iar modificarea care i-a fost adusa, daca a fost una si eu cred ca da, face ca rezultatele sa fie diferite - par sistematic diferite - dar nu ne-explicabile si nu ne-reproductibile luand in considerare modificarea.
Gandeste-te la scenariul urmator : saltul asta datorat noului algoritm afecteaza toate site-urile in acelasi fel deci rankingul relativ ramane exact acelasi ca si inainte, doar ranking-ul absolut se schimba. Schimba asta cu ceva lucrurile fata de "vechea" metoda de calcul? Nu. Mai este miciuna? Deloc.
Alt scenariu. Un studiu, de data asta stiintific, publica niste rezultate intermediare care conduc la niste concluzii, dupa aceea isi adapteaza metodologia dintr-un motiv X sau Y care sa il consideram legitim si justificat iar asta conduce la alte rezultate (care hai sa zicem ca nu schimba radical concluziile, doar cifrele). Iarasi, cat de tare invoci argumentul "minciunii"?
Au emis vreodata cei de la Alexa ca detin adevarul asupra ranking-ului? In masura in care el insusi este ceva stabilit pe criterii de pertintenta care depind strict de cei care le aleg. De ani de zile exista discutii despre bias-urile masuratorilor celor de la Alexa si ce implicatie au ele asupra rezultatelor publicate. Intr-o astfel de nebuloasa sa aduci notiuni de alb vs. negru, minciuna vs. adevar inseamna lipsa de recul.
Thursday, 23 April 2009
Ei, uite minune, ca nu le afecteaza deloc la fel.
Blogguri neafectate
http://www.alexa.com/siteinfo/huffingtonpost.com
http://www.alexa.com/siteinfo/thinkprogress.org
http://www.alexa.com/siteinfo/gawker.com
http://www.alexa.com/siteinfo/perezhilton.com
Prabusit
http://www.alexa.com/siteinfo/valleywag.com
Mai sunt exemple la ambele categorii.
Thursday, 23 April 2009
Eu ma asteptam ca articolul asta sa fie despre altceva !
Thursday, 23 April 2009
@ri : Hehe ceva teme politice ?
@Dan Anghel : Reflectand la chestiune, ma gandesc ca disputa s-ar putea rezuma cam asa :
Faptul ca alexa pune rezultate obtinute prin doua procedee absolut diferite pe acelasi grafic ii descalifica, stiintific, in ochii mei. Mai ales ca schimbarile nu sunt sistematice, ci mai degraba par aleatorii.
Odata asta, faptul ca prezinta anumite ideologii (sau cum le numim, o ordonare subiectiva a unor site-uri) ca fiind "statistica", ma face sa-i privesc drept cel adanc soi de mincinosi, statisticienii lui Mark Twain.
Pentru tine, faptul ca-s pe acelasi grafic nu are mare importanta, fiind mai mult un amanunt, detaliu nesemnificativ. Mot d'esprit care e titlul postului nu-ti pare neaparat relevant, cand el este cheia in care am gandit intreaga problema.
Gasesti ?
Thursday, 23 April 2009
Nu neaparat o tema politica , dar nu despre statistici .
Thursday, 23 April 2009
* nu despre statisticile oferite de alexa !
Friday, 24 April 2009
Au contraire, faptul ca poti vedea intr-un acelasi trafic datele pe 6 luni are avantajul enorm ca iti permite sa vezi saltul si sa te chestionezi asupra lui.
Friday, 24 April 2009
Uite si o explicatie posibila in algoritmul Alexa care s-ar fi produsla sfarsitul lui Martie. Pare sa fie legat de traficul care vine de la siteurile de social networking care la un moment dat a fost scos din calcul iar acum este luat din nou (deci nu suntem la primul jump intr-un sens sau altul de asemenea proportii) si care poate avea impact foarte mare asupra rankingului unor bloguri :
http://www.dailyblogtips.com/big-changes-in-the-alexa-algorithm/
A propos, asta ar explica si de ce vezi salturile impresionante la blogur si nu la site-uri media "traditionale".
Cum spuneam intr-un comentariu precedent, criteriile pe care Alexa calculeaza ranking-ul depind pur si simplu de cei care le aleg. Asta nu e nici stiinta, nici statistica si nici nu are prententia de a se considera astfel.
Friday, 24 April 2009
Ei, eu spun ca are pretentia de a fi stiinta, si pretentia de a fi considerata astfel, odata ce oamenii chiar sustin ca ofera un serviciu, care chipurile sa ajute profesionistii din media buying, de exemplu, si odata ce alti oamenii chiar ii folosesc ca atare.
Friday, 24 April 2009
lol, alexa ajuta profesionistii din media buying? fii serios. e un tool de estimare, e bun cand n-ai altceva la indemana. si ei si compete.com fac estimari din burta.
Friday, 24 April 2009
Din gura lupului citire : http://www.alexa.com/company
Alexa's Web site is built on the notion that timely and relevant information is essential to a vital web experience.
Alexa Site Information - Alexa has built an unparalleled database of information about sites that includes statistics, related links and more.
Da, ok, ai dreptate, "essential to a vital experience". Burtologie.
Wednesday, 29 July 2009
Nu stiu cat de relevante pot fi statisticile de la Alexa din moment ce sunt facute cu ajutorul Toolbarului propriu. Oricum este o diferenta intre sistemul oferit de Google si Alexa si asta nu este tocmai ok
Wednesday, 29 July 2009
Bun dar chiar si folosind toolbar-ul propriu, exploziile alea nu pot fi explicate.
Chiar daca folosesti un binoclu vechi rusesc, nu poti privi inspre un reper pe care il masori in fiecare zi ca 100, 110, 105, 96 dupa care brusc 756644000 , 70879000, 81932000 etc. Cum drac trece de la sute la milioane ? Ai intors ocheanul ?!
Saturday, 2 January 2010
Eu nu mai am incredere in Alexa de mult, nu stiu parerea voastra, dar alexa afiseaza statistici aiurea.