Trafic.

Wednesday, 18 February, Year 1 d.Tr. | Author: Mircea Popescu

Tin minte o vreme cand "trafic" era de rau. Mai la-nceput insemna ca te-or baga comunistii la inchisoare ca te-or prins cu mai multa ciocolata decat era ingaduit cetateanului multi-lateral dezvoltat (adica 0), ori doamne fereste cu prezervative sau ceva. Mai dupa abuziv-impuscarea conducatorului iubit, insemna tot de rau, ca umblai cu gagici, arme, droguri, lucruri grele.

Trecut-au anii ca nori lungi pe sesuri, asa, vre-o zece, si se descoperi nu doar Internetul, ci de-a dreptul blogul si-n scumpa noastra patrie, cu intarzierea de rigoare. Acum, toata lumea vrea trafic, are trafic, n-are trafic, destul ori insuficient, conteaza, se compara, se deduce, se genereaza...

Bine. Dar ce este, pana la urma, traficul asta pe stil nou ?

Este doua lucruri, care-s trei. Astea trei sunt asa :
Uniques. Fiecare calculator de pe Internet are o adresa, unica, 8 octeti doar ai lui, grupati cate doi. Ceva de genul 78.197.66.166. I se mai spune is IP, care e prescurtarea de la IP address, care e prescurtartea de la Internet Protocol address. Deci, tehnic vorbind, 78.197.66.166 nu-i "IP-ul unui calculator", ci "IP address-ul unui calculator", dar sa trecem.

Aceste adrese sunt unice dintr-o necesitate absoluta. Cand X vorbeste cu Y pe retea, X are nevoie de o metoda pentru a-l identifica pe Y in mod unic, deosebit de toti ceilalti Z ce-or fi si ei pe acolo. Ca atare, fiecare calculator are numarul lui, si aia-i adresa.

Uniques atunci sunt numarul de adrese distincte cu care discuta un calculator anumit. De exemplu in lista 6,7,9,11,5,6,11,5,11,5,11,7 avem in total 12 numere, dar 5 numere unice : 5,6,7,9,11. Exact la fel se socotesc si uniques : numarul de adrese unice. Daca un website are 100 uniques intr-o zi, asta nu inseamna decat ca 100 adrese diferite au discutat cu serverul in ziua respectiva.

Problema cu aceasta notiune este ca nu e aditiva. Hai sa ne lamurim printr-un exemplu : Fie ziua I, cu lista 6,7,9,11,5,6,11,5,11,5,11,7 si ziua II, cu lista 4,7,9,4,5,6,3,5,11,5,11,4. Ei, in ziua I avem 12 numere din care 5 unice. In ziua II avem tot 12 numere, din care 6 unice : 4,5,6,7,9,11. Cate numere unice avem atunci in cele doua zile, ziua I + ziua II ? 5 + 6 = 11, da ? Nu. Dupa cum puteti constata comparand listele, in total avem de fapt fix 6 numere unice.

Deci, unicii zilnici din doua zile adunate vor fi in total o valoare anumita (si impredictibila) intre valoarea zilei celei mai mari si suma aritmetica a celor doua zile. Daca n-am fi vazut cele doua liste, si ni se spunea doar, ziua I : 5 unici, ziua II : 6 unici, cati unici total ? Raspunsul nu poate fi altul decat "intre 6 si 11". Nu 11. Nici 6. Ci undeva, intre. Singurul mod de a afla concret e a compara listele.

Pageviews. Orice website e format din pagini. Fiecare client care citeste o pagina de pe server o obtine cerand-o serverului, exact asa cum cartile in biblioteca se obtin cerandu-le bibliotecarului. Serverul poate atunci sa numere de cate ori i-au fost cerute pagini.

Problema cu aceasta masura este ca nu reflecta neaparat ceva anume : Daca un oarecare apasa butonul de refresh din browser de 10 ori, serverul va nota ca pagina cutare i-a fost ceruta de 10 ori. Daca acelasi oarecare seteaza browser-ul pe auto-refresh si se culca, serverul va numara linistit sute de pagini.

Visits. A treia idee incearca sa raspunda unor probleme punctuale. La inceputurile Internet-ului ca fenomen de masa, AOL, un provider din SUA, a folosit un sistem prin care relativ multi utilizatori se conectau prin intermediul unui numar relativ mic de gateways, toate avand aceeasi adresa, distributia pachetelor catre clientii finali facandu-se apoi printr-o metoda proprie. Ca rezultat, multi oameni diferiti se vedeau pentru restul Internet-ului ca o singura adresa.

Pentru a complica si mai bine problema, multi provideri de internet in zilele dial-up foloseau un "pool", adica o lista de adrese IP pentru a conecta un numar relativ mare de utilizatori. Daca spre exemplu AT&T avea 10,000 de utilizatori de Internet prin dial-up, si 3,000 de adrese IP, ficare utilizator care se conecta la Internet primea alocata o adresa disponibila. Odata ce inchidea conexiunea, adresa revenea disponibila. In principiu, aceeasi adresa putea servi in aceeasi zi pentru a conecta la Internet sute de oameni diferiti.

In plus, serverele proxy, si routere NAT aplica cam aceeasi abordare, pe o scara mai mica. Eu scriu aceste randuri, spre exemplu, de pe un calculator conectat la internet printr-un router NAT. Alaturi de acest calculator, prin acelasi router se mai conecteaza altele doua. De pe oricare dintre ele as scrie eu, Internet-ul ar vedea acelasi IP - al router-ului. Ele sunt, totusi, calculatoare diferite, si ar putea fi folosite de oameni diferiti, la etaje diferite ori in cladiri diferite, oameni ce poate nici nu se cunosc intre ei.

Si mai important, acelasi utilizator poate citi pagini ale aceluiasi website de pe calculatoare (si adrese IP) diferite. Spre exemplu, acasa si la birou, sau la plimbare oprind in fiecare Internet Cafe.

Teoretic vorbind, s-ar putea introduce criterii pentru a identifica o "vizita", independent strict de IP, ca spre exemplu luandu-se in considerare timpii de utilizare (daca un calculator acceseaza 5 pagini pe un website in 10 mintue, apoi pauza 2 ore, si apoi din nou, 6 pagini in 12 minute se poate spune ca doua "vizite" diferite au avut loc), ori un protocol special cu browser-ul (de exemplu, cookies), sau session-links (adica, vizitand website-ul x, adresa de web nu va fi http://x.com/index.php, ci http://x.com/index.php?sessionid=010111010, diferentiind astfel doi utilizatori intre ei).

Practic vorbind, nici unul dintre aceste criterii nu masoara un lucru anumit cu vre-o certitudine precizabila.

Tocmai de aceea am spus ca sunt doua lucruri care-s trei : Logic vorbind, nu putem masura decat numarul de adrese diferite cu care discutam, si numarul de pagini cerute. Practic vorbind, putem incerca sa masuram cele trei chestii discutate mai sus.

Evident, toate prostiile astea nu intereseaza, in de sine, pe nimeni. Ce intereseaza lumea este de exemplu un raspuns la intrebarea simpla "Eu contez ?", cu cele doua sub-intrebari, "Cat de mult ?" Si "Pentru cati oameni ?".

Ei bine, corelatia intre aceste trei intrebari si cele 2-3 masuratori la dispozitie este mai degraba slaba. 10,000 uniques lunari poate sa insemne 120,000 de oameni intr-un an, sau 10,000. 5,000,000 de pageviews poate sa insemne un tiraj echivalent cu al unui ziar mare din New York sau Tokio, sau un program defect pe undeva care citeste cu spume la gura aceasi pagina in fiecare zecime de secunda. Cinci vizite pot fi doi oameni care-au luat o pauza de facut mancare in mijlocul lecturii.

Numai din aceste motive, si deja este destul de limpede cam cat de putin inseamna "traficul" in termenii intrebarilor cu adevarat angoasante, si asta fara a lua in considerare niste aspecte foarte importante :

Cine sunt acesti cititori ? "Uniques" se bazeaza pe ideea ca orice doi cititori sunt egali intre ei, dar intuitiv asta e o prostie : Un website citit de 3 clase de liceu, 100 de oameni in total, e tot una cu un website citit de jumatate din participantii la forumul Davos, tot 100 de oameni in total ? As zice ca nu.

Dar un website citit de 25 de fanatici, credinciosi intr-un cult bizar, e tot una cu un website citit de 25 de motoare de cautare ori agregatoare ? Daca guru scrie ca nu se poate trai fara apa de ploaie indulcita cu miere pe primul, rezultatul vor fi 25 de cumparatori de apa de ploaie indulcita cu miere. Daca scrie acelasi lucru pe al doilea, rezultatul vor fi 25 de scripturi repetand inebunite in mii de locuri chestia cu apa de ploaie indulcita.

In scurt, gresala de a considera traficul masurabil, asa gresita cum este ea, paleste in comparatie cu stupizenia de a considera traficul fungibil, adica, oricare doua parti egale cu oricare altele doua. Nici vorba de asa ceva.

Aceste idei sunt intr-o oarecare masura aplicabile, statistic vorbind, pentru website-uri mari (mari, dar la dimensiuni de care nu-i cazul in Romania, vorbim de milioane de utilizatori zilnici, nu anuali) din aceeasi zona de interes. In principiu, intre cei 16 de milioane de cititori ai Wall Street Journal si cei 10 sau 20 de milioane a celor catorva competitori nu exista, statistic vorbind, diferente fundamentale.

Chiar si aceasta teorie este hazardata, si justificata strict din nevoia de reprezentare a realitatii in termeni economici, nu din vre-o realitate subiacenta. A aplica aceleasi aproximari unor site-uri care obtin o sutime din acelasi trafic, sau chiar in cazuri extreme, unor bloguri ce obtin nu o sutime, ci cateva sute de vizitatori e dincolo de absurd : e ridicol.

Concluzia care se impune este remarcabil de scurta : Traficul nu exista. Treceti peste.

Comments feed : RSS 2.0. Leave your own comment below, or send a trackback.

31 Responses

  1. Citii cu maximum de atenţie, fiindcă unele dintre informaţii îmi erau necunoscute, mea culpa. Dar mă consolai cu gândul că nimeni nu este perfect...

  2. Mircea Popescu`s avatar
    2
    Mircea Popescu 
    Wednesday, 18 February 2009

    Tocmai de-aia am si scris cat de explicit, web-ul fiind foarte atractiv social, putini dintre utilizatori apuca sa-l cunoasca sistematic si in profunzime.

    Nu pentru ca lucrurile-s cine stie ce complicate, ca nu-s, dar nici nu se prea gasesc explicate structurat si cu rabdare.

  3. Mircea,

    Legat de irelevanta traficului: DA si NU.
    Da pentru ca nu putem compara vacanta ta si vacanta mea dupa cum ne put ciorapii. Nu pentru ca da, pot compara dupa mirosul ciorapilor cum au evoluat vacantele mele.

  4. "Concluzia care se impune este remarcabil de scurta : Traficul nu exista. Treceti peste."

    mai exact cum anume nu exista? ... daca traficul nu exista, cum analizezi performanta unui site?

  5. chestia cu "numaratul" vizitatorilor unici nu o stiam. ah, si de exp, de ce exista totusi diferente destul de mari intre, sa zicem, rezultatele furnizate de trafic.ro si analytics?

  6. Mircea Popescu`s avatar
    6
    Mircea Popescu 
    Thursday, 19 February 2009

    @Adrian : Intr-un sens da, Adrian, dar sub care aspect ? Al igienei personale ? Al calitatii produselor anti-put de pe piata ? Al nivelului de testosteron ? Al rezistentei la efort ? Al propensiunii spre umblet ?

    Sigur ca le poti compara, pe ale tale intre ele, dar la fel de bine cum le poti compara cu ale mele : fara sa poti spune concret ce compari de fapt.

    @selfhelp : Notiunea de "performanta unui site" aplicata unor site-uri mici este o notiune vida. Nu are sens. Este de aceeasi valoare intelectuala ca notiunea de a compara "frumusetea" a doua colege de curs.

    E important ca "mici" nu inseamna "oricine cu mai putin trafic decat am eu", sau "oricine cu mai putin trafic decat are bloggerul meu favorit". Mici inseamna site-uri care ating sub o miime din populatia Internet-ului, mici inseamna site-uri sub un milion de unici zilnici. Asta fel de mici.

    @Wonders : Am sa scriu in curand un post in care sa explic in detaliu cam cum apar asemenea diferente, e o discutie mai lunga.

  7. Acest articol l-am citit de la cap la cap si mi-a placut , cu exceptia finalului .
    Cel mai tare imi placu exemplu cu " daca acelasi oarecare seteaza browser-ul pe auto-refresh si se culca, serverul va numara linistit sute de pagini " ;)
    Eu cred totusi ca traficul conteaza , chiar daca nu ai de unde sa stii daca te citeste toata scoala cu clasele I-IV din Ciorogarla sau partcipantii forumului Crans Montana !

  8. @Mircea Popescu >> @selfhelp : Notiunea de “performanta unui site” aplicata unor site-uri mici ...

    Sa presupunem ca exista un site care vinde periute de dinti (or whatever produs de nisa). Sa presupunem ca din 100 de vizitatori targetati cumpara unul, iar media este undeva in jur de 1-2% in functie de calitatea sursei traficului. Procentul de conversie in vanzari sau leads variaza in functie de "oferta" care e scrisa pe site, mai exact in "vrajeala" cu care vinzi pasta de dinti.

    Deasemenea procentul de conversie la vanzari sau leads e influentat de mesajul publicitar (bannere, text, etc) de pe siteurile care aduc traficul.

    Crezi ca tooluri precum split-testing, multivariate testing (ex: google website optimizer) au fost create degeaba?

    Si da, toate astea sunt la fel de importante si pentru un site nu mic cum zici tu, ci minuscul, poate cu 100-200 vizitatori zilnici.

    Poate siteul ala e pe nisa de barci cu motir, si are 100 vizitatori si unul cumpara o barca de $100k, iar comisionul este 10%.

    Conteaza sau nu?

    Nu trebuie sa fii neaparat amazon ca sa faci analiza de performanta pe trafic.

    Argumentele tale nu m-au convins ca traficul nu exista si performanta este vida. Sunt la fel ca cele teologice, uneori suna bine, dar coerenta logica este 0. No offense.

  9. Mircea Popescu`s avatar
    9
    Mircea Popescu 
    Thursday, 19 February 2009

    Stai frate. Tu vorbesti de site-uri de vanzari. Nu discut aici asa fungibilitatea traficului de porn, de exemplu. Evident, oamenii ce vor sa cumpere ceva sunt toti echivalenti cu alti oameni ce vor sa cumpere acelasi ceva, si asta face rationamentele statistice de mai sus mult mai bine intemeiate.

    Dar eu vorbeam de site-uri content-based, ca de exemplu bloguri, ziare, site-uri de news, etc.

  10. Sa spunem ca ceea ce nu se aseamana, nu se poate compara cu folos ci doar filozofic.
    Orice site de content cum ii zici tu are un target.
    Si poate in timp dezvolta o formula proprie de conversie a calitatii traficului in ceea ce numeste succes.
    De aceea zic: pentru fiecare site in parte traficul/calitatea lui are o relavanta.
    Dreptate ai atunci cand spui ca o comparatie intre site-uri pe baza de trafic e putin relevanta.

  11. Mircea Popescu`s avatar
    11
    Mircea Popescu 
    Thursday, 19 February 2009

    In masura in care are un target, si niste criterii/principii/doleante, auto-comparatia, sau comparatia istorica asa cum propui tu capata sens, cu atat mai mult cu cat ele sunt mai clar definite.

    Imi pare ca rar se intalneste asa ceva in practica, totusi.

  12. Exceptand "hit and run!" evaluarea istorica e cea mai solida metoda.

  13. sunt curios cum esti clasat daca folosesti wireless-ul intr-un hotspot? de pe telefon, sa zicem.

  14. Mircea Popescu`s avatar
    14
    Mircea Popescu 
    Thursday, 19 February 2009

    Pe IP-ul hotspot-ului.

  15. bun. şi dacă te pune cumva mintea să faci prostioare pe acolo, cum dau autorităţile de tine?

  16. Mircea Popescu`s avatar
    16
    Mircea Popescu 
    Saturday, 21 February 2009

    Asta cu datul autoritatilor de tine e asa o traznaie.

    Internetul nu are "autoritati", el se bazeaza pe ideea ca oamenii de-or ajuns pe el sunt destul de intelepti incat sa se comporte civilizat din propria lor putere.

  17. nu despre asta ziceam. ci să zicem că, ipotetic ai intra de pe un terminal pe hot-spot ca să goleşti contul altora.

    cum ai putea fi prins dat fiind că tu intri de pe ip-ul hotspotului?

  18. Mircea Popescu`s avatar
    18
    Mircea Popescu 
    Saturday, 21 February 2009

    Ai fi prins asa cum sunt in general prinsi escrocii : dupa urma banilor.

  19. Vanessa`s avatar
    19
    Vanessa 
    Sunday, 5 July 2009

    Domnilor...am o problema! Se poate afla IP-ul unui calculator dupa adresa de e-mail?

  20. Mircea Popescu`s avatar
    20
    Mircea Popescu 
    Sunday, 5 July 2009

    Daca te uiti in "Full headers" si scrie acolo, da. Daca nu, nu.

  21. Vanessa`s avatar
    21
    Vanessa 
    Sunday, 5 July 2009

    Am inteles...multumesc frumos!...dar eu nu am trimis e-mail-ul in yahoo., ci la o adressa cu... @oltenia.ro. Crezi ca se poate vedea ip-ul meu? :(

  22. Mircea Popescu`s avatar
    22
    Mircea Popescu 
    Sunday, 5 July 2009

    Depinde daca are scris IP-ul in "Full headers". Mergi frumos si cauti mesajul intre mesajele trimise, si te uiti.

  23. Vanessa`s avatar
    23
    Vanessa 
    Sunday, 5 July 2009

    Da, are :(((...ce nasol, sunt varza!!!! Multumesc tare mult pentru ajutor! O seara buna sa ai!

  1. [...] sa fii mult, da’ mult deasupra celuilalt. Nu in termeni de cirje si pseudopode a la trafic, ci in singurii termeni care conteaza : inteligenta, cultura, abilitatea discursiva, chestii [...]

  2. [...] fapt, daca ne apucam si adunam unic cu unic din proiecte diferite (ceea ce-i o timpenie, cum am mai explicat deja, unicii nu-s scalari sa se adune ca greutatile pe teoria ca daca avem cinci fete de cincizeci de [...]

  3. [...] Cardinalitatea acestui tabel tocmai ce a depasit 500,000. Asta inseamna ca jumatate de milion de IP-uri unice au vizitat Trilema in ultimele ~7 luni. Nu mai intru in discutia diferentei intre unici si “suma unicilor”, ca s-a facut deja. [...]

  4. [...] ca discutia despre numarul de cititori e la rindul ei confiscata de discutia despre “trafic“, intr-o completa si bovina confuzie asupra diferentelor intre cele doua chestiuni. Totusi, [...]

  5. [...] cum sa va spun cit de putin relevanti pot fi 10 mii de unici pe zi timp de o saptamina (ceea ce nu, nu inseamna 70 de mii de unici pe saptamina). Ma gindesc ca va prindeti voi. Daca nu putem eventual observa ca [...]

  6. [...] de statistici ? Ca poate n-ai inteles chiar exact cum e cu “masurarea” traficului astuia. Poate nu stii ca Alexa-i relevanta si reprezentativa pentru .com si trafic de pe la o suta [...]

  7. [...] do, wat do! ———A meaningless, in theory as well as any practical implementation (I have more examples than words). See also this footnote [...]

  8. [...] do, wat do! ———A meaningless notion, in theory as well as any practical implementation (I have more examples than words). See also this footnote [...]

Add your cents! »
    If this is your first comment, it will wait to be approved. This usually takes a few hours. Subsequent comments are not delayed.