Performante peste medie

Saturday, 30 April, Year 3 d.Tr. | Author: Mircea Popescu

Daca tot am executat un regal statistic cu ocazia TBR, care-a atras un numar de curiozitati din partea unei largi varietati de cetateni nebotezati in misteriosul cult al numerelor lipsite de corespondent in realitate denumit pompos "statistica teoretica", hai sa facem si citiva pasi introductivi.

In principiu, cam noua oameni din zece (precum si nouazeci dintr-o suta si noua sute de mii dintr-un milion) se considera soferi "mai buni decit media". Cam aceeasi proportie se considera "empatici", "amuzanti" respectiv "capabili sa prinda glumele", tot idem "mai frumosi decit media", mai inteligenti decit media si asa mai departe. Pe scurt, orice calitate slab definita dar valorizata pozitiv in societate am alege, o zdrobitoare majoritate dintre subiecti se vor considera "mai buni decit media".

Ei bine, ca sa vedeti chestie, majoritatea oamenilor au impresia ca inteleg statistica mai bine decit media! (Nu decit media insasi vreau sa zic, nu se compara ei cu conceptul abstract de-i fiul drept al insasi stiintei respective, ci decit media "celorlalti oameni [...]", unde [...] poate fi absolut orice). Rugati sa aduca o dovada in favoarea acestei evaluari a lor, majoritatea zdrobitoare a oamenilor aduc o dovada irationala.

Care, in majoritatea zdrobitoare a cazurilor, este o varianta izomorf-omoloaga urmatoarei observatii : Desi 90% dintre oameni au impresia ca sunt soferi "mai buni decit media", asa ceva nu este posibil, din motive statistice. Cel mult 4x% din oameni pot fi "mai buni decit media".

Problema cu acest rationament este urmatoarea : un numar oarecare de oameni au doua picioare. Un alt numar oarecare de oameni, cu siguranta semnificativ mai mic decit primul, au cite un singur picior fiecare. In fine, inca un alt numar de oameni, iarasi mic in raport cu primul, nu au picioare deloc. Este teoretic posibil sa existe si oameni cu 3, 5 sau 19 picioare, dar inca nu s-a intilnit asa o minunatie.

Ca atare, la fiecare moment anumit, numarul mediu de picioare al oamenilor este cel mult 2, si probabil ceva peste 1. Admitind ca grupul luat in discutie este suficient de mare pentru a include macar un schiop (ca de exemplu, "populatia Transilvaniei" sau "oamenii nascuti in anul 1990"), e evident ca valoarea medie nu are cum fi 2, si deci oricine are doua picioare are mai multe picioare decit media. Pentru ca are numarul maxim de picioare posibil, si media nu poate fi egala cu maximum-ul decit in anumite situatii extrem de particulare (sau in termeni statistici, doar in grupuri nereprezentative).

Chestia asta cam scufunda observatia cea inteligenta a statisticienilor amatori, dar n-am chiar terminat. Fie un set de zece oameni, care primesc note pentru abilitatea lor de-a conduce masina, pe o scara de la 1 la 10. Note acordate de Dumnezeu Tatal, intr-o comisie condusa de Trompi si la care mai participa si Allah, Buddha, Sitra etc etc. Nici o putinta de eroare in masuratoare, bun ?

Ei, daca unul dintre cei zece ia nota 1,08 iar ceilalti iau toti note cuprinse intre 9,05 si 9,15, fara a lua nimeni 10 (si deci, nota maxima, ca-n exemplul anterior), totusi media va fi undeva in jur de 8. Care 8 este mai mic decit 9,05, si iata cum... 90% dintre soferii grupului sunt... mai buni decit media.

Iata deci ca statistica-i o stiinta complicata, si toate bizdiganiile alea cu medie si median si mod si abateri standard etc scl nu-s tocmai degeaba, ci au si ele importanta lor. Anume, ne ingaduie sa ne asiguram ca nu ne aflam cumva in situatia celor ce-si intemeiaza superioritatea intelectuala in intelegerea lumii asteia pe idei izomorf-omoloage teoriei ca doar 4 soferi din 10 pot fi "mai buni decit media".

Spor :)

Category: Trilenciclopedia
Comments feed : RSS 2.0. Leave your own comment below, or send a trackback.

14 Responses

  1. Pai na, canta zeita media pe toate gardurile, dar numai daca e distributie Gauss ca altminteri nu prea e ceea ce te astepti :D

  2. Mircea Popescu`s avatar
    2
    Mircea Popescu 
    Saturday, 30 April 2011

    Tu zici de mass-media, da' io ziceam de media aritmetica sa stii.

  3. mitzaabiciclista`s avatar
    3
    mitzaabiciclista 
    Saturday, 30 April 2011

    Hehehehe. Şi eu m-am izbit de chestiunea în speţă de multe ori. Şi cel mai al naibii e când trebuie să îi explici unuia care nu vrea să priceapă.
    Hmmm. Ex, că ştii că îmi plac puii(sau ai observat) Puii care se cresc pentru abatorizare se cântăresc odată la 7 zile pentru a li se urmări şi înregistra sporul în greutate pe graficul de creştere. Într-o hala unde sunt 20000 de capete, normal că nu stai să cântăreşti din 7 în 7 zile toţi puii fiindcă: 1 intri la balamuc, 2.mor puii de atâta stress, 3 intri la balamuc fiindcă au murit puii. Dar în fine, deci se cântăresc un eşantion de 50 de pui , care eşantion nu e acelaşi. Şi apoi se face o medie, se trece în graficul de creştere şi se compară cu rezultatele teoretice specifice fiecărei rase, pentru bunul mers al puiului, desigur. După cele 38-40 de zile cât îi ajunge puiului să ajungă la minimul de 2.2 kg se merge la abator. Acolo se face o cântărire pe camion plin cu animale-camion gol de animale(brut-tară=net) Apoi netul total se împarte la numărul de capete. Logic, nu? Ei bine, mi-a luat luni întregi să le explic unora de ce media greutăţii per total capete hală este mai mică decât media greutăţii per total capete eşantion. Şi deşi am argumentat de fiecare dată, matematic. Hell. Şi acum am coşmaruri când mă gândesc

  4. Mircea Popescu`s avatar
    4
    Mircea Popescu 
    Saturday, 30 April 2011

    Problema-i asa : daca media greutatii per total esantion 1 (brut-tara) e constant inferioara (sau constant superioara) mediei greutatii per esantion 2 cintarit individual (50 de pui) rezulta ca aveti o problema sistematica.

    In practica, asta-i fie din cauza ca nu alegeti corect puii (din nenumarate motive posibile, pentru ca fata de-i cintareste ii alege pe aia mai faini, sau pentru ca fata care-i alege prefera sa-i ia pe cei mai accesibili si din ceva motiv aia mai mari is mai accesibili etc) fie din cauza ca va fura la cintar cu camionul (frecvent se fura la receptie scazind marginea de eroare din greutatea cintarita, de exemplu).

    Chestiunea merita investigata, mai ales daca variantele nu diverg corect.

  5. mitzaabiciclista`s avatar
    5
    mitzaabiciclista 
    Saturday, 30 April 2011

    Nu, indiferent cât de bine ai alege, sau mai bine zis cât de corect ai alege, trebuie să ţii cont de un lucru. Puii nu sunt egali, nu mănâncă egal, nu cresc egal. Ca şi la oameni de altfel. Şi oricât de corect ai alege eşantionul, nu ai de unde să ştii numărul exact de pui a căror greutate nu este conformă. Nu vorbesc aici de diferenţe mari. Vorbesc de diferenţe relative. La diferenţe mari probleme se pun altfel.
    Deci indiferent cât de bine ai gestiona, nu ai cum să realizezi numărul exact al celor care nu îndeplinesc greutatea specifică. Căci dacă acel număr este într-un procent de 10% automat asta îţi va influenţa rezultatul dar nesimnificativ. Într-un procent de 20% se simte, de la 30% te oftici, de la 50% îţi bagi unghia, şi tot aşa. La 7, 14 zile de viaţă diferenţele se văd la ochi liber, iar cele arătate de cântar doar confirmă şi automat aplici metode de redresare. De la 28 de zile, diferenţele mai sunt vizibile doar dacă acestea chiar există. Iar când ajungi la 35 de zile crede-mă, oricât ai fi tu de şmecher, nu faci diferenţă la o simplă aruncătură de ochi intre doi pui care diferă la greutate doar cu 200 de grame.
    Probabil acum îţi vine să râzi, că vorbesc de diferenţe de grame. Doar că nu e amuzant când o diferenţă de chiar şi 100 grame pe medie se înmulţeşte cu un număr de 20000 de capete, fiindcă asta înseamnă 2000 kg de carne x 4,2 kg=8400 lei, care zic eu nu sunt de colea. Dar nu este o consecinţă de neatenţie, sau eroare umană, voită sau nevoită. Sunt factori care influenţează negativ, factori care îi poţi diminua dar nu elimina.
    Până şi viteza de circulare a aerului în hală poate fi un factor care să influenţeze negativ. Hmmm, dar e o teorie atât de stufoasă că ne-ar lua zile întregi să dezbatem. Pfff acaparăm postul cu asta. Dar ideea mi-ai inteles-o oricum!
    Te pup pe barbă, dar acuma chiar fug în lume, îmi iau câmpii. Ne revedem, luni.
    .kiss

  6. Mircea Popescu`s avatar
    6
    Mircea Popescu 
    Saturday, 30 April 2011

    Stai putin mei om, ca nu m-ai inteles.

    Deci, fie o hala cu 10,000 de pui in ea, ale caror greutati variaza intre 1600 si 2600 de grame. Fie esantionul 1, camion de pui, cu 2,000 de capete in el. Fie esantionul 2, cu 50 de capete in el.

    Esantionul 1 se masoara pe metoda brut-tara, si rezulta o greutate totala de 4 tone (4,000,000 grame) si deci o greutate per cap de 2,000 grame.

    Esantionul 2 se masoara pe metoda cintarire individuala, si rezulta 50 de greutati, pe plaja 1822 - 2495 grame.

    Daca diferenta intre media 2 si media 1 este mereu si intotdeauna pozitiva, sau daca este mereu si intotdeauna negativa, sau daca este mereu si intotdeauna egala cu 19, sau daca in general vorbind nu se imprastie rezulta ca aveti o problema sistematica, ori in ce priveste esantionarea (la 1, la 2, la amindoua), ori in ce priveste cintarirea, ori in ce priveste socotelile (cineva nu stie imparti, sau aduna, etc).

    Pentru ca nu este posibil sa convearga rezultatele alea din cauze naturale.

  7. mitzaabiciclista`s avatar
    7
    mitzaabiciclista 
    Saturday, 30 April 2011

    Nuuuuuuuu, nu ai voie la o asemenea diferenţă. Dacă sunt diferenţe de 1 kg per cap de pui, înseamnă că puii sunt bolnavi, sau liniile de furajare nu merg corect, sau frontul de adăpare nu a fost alimentat corect, sau au vârste diferite, sau naiba să ii ia.
    Eu vorbesc de diferenţe apărute la 1, maxim 200 de grame pe medie.
    Pfff, e altceva.
    Când mă întorc promit să îţi explic dacă te pasionează. dar cum pui tu problema nu e bine. Ca daca s-a ajuns la asa ceva înseamnă că acel crescător e Nepriceputeanu in persoană.
    Singura mea idee a fost că dacă greutăţile eşantionului au fost aproximativ în grafic pe toată durata creşterii, te poti astepta la diferente la final, in abatorizare, de respectiv 100-200grame/cap. Ceea ce tehnic nu e grav, e ok. Comercial însă, când vine vorba de incasat banii, acolo te scarpini in cur neintelegand de ce naiba e aşa, ca tu îţi faci calculul că esti in grafic si de fapt ai o eroare. Uneori si un 0.1% poate sa iti dea un plan peste cap.
    Mai vorbim, chiar ca urla lumea la mine acuma ca nu ma ridic de aici.

  8. Mircea Popescu`s avatar
    8
    Mircea Popescu 
    Saturday, 30 April 2011

    Nu conteaza amplitudinea diferentei in discutia noastra. Tot ce conteaza este ca uneori rezultatele masurarii prin metoda camion trebuie sa fie mai mari decit evaluarile prin metoda cintarire individuala, si alteori mai mici. Daca sunt tot mereu mai mari, sau tot mereu mai mici, cineva (sau ceva) undeva fura. Fara discutii posibile, e un fapt.

  9. Mdefapt ce zice Miţa voiam să semnalez şi eu: la foarte multe grupuri, media cea mai reprezentativă este una făcută excluzând erorile statistice. Oamenii normali născuţi în 1990 aveau la naştere două picioare.

    Un copil obez acum 50 de ani nu reprezintă nimic, fiind el 1/1000 sau 1/10000 sau cât era raportul. În orice caz, media reprezentată în mentalul colectiv reprezintă mai mereu o plajă, nu un punct fix. Un şcolar mediu are note între 6,5 şi 8,5 (să zicem).

    Besides, din câte observ se întâmplă o substituire de noţiune: spui "media" şi omul înţelege "majoritatea". Nu, nu am mai multe picioare decât majoritatea.

  10. Mircea Popescu`s avatar
    10
    Mircea Popescu 
    Saturday, 30 April 2011

    Pai se produc tot felul de confuzii.

    In primul rind ca elementul care apare cel mai frecvent nu-i elementul mediu, ci modulul (de exemplu in setul de date pe care-i alcatuit TBR, modulul iese 50, pentru ca 50 e cea mai frecventa valoare in grup).

    In al doilea rind ca "media" inteleasa drept plaja, de la jumatate - epsilon la jumatate plus epsilon este mediana, nu media.

    Si-n ultimul rind ca eu vorbeam de oameni nascuti in 90 traitori astazi, deci de 21 de ani, sigur undeva pe planeta exista si un schiop printre ei, n-are cum.

    Iar in mai-mult-decit-ultimul rind, media nu este reprezentativa, in sensul general al notiunii de reprezentare.

  11. Lol, ai dracu pui inegali, cum se face ca intotdeauna ies pe minus si niciodata pe plus. Ma gandesc ca daca cantarirea se face la client, puii aia vor fi mai usori pentru ca in timpul drumului pe camion n-au mancat si n-au baut apa.

  12. Mircea Popescu`s avatar
    12
    Mircea Popescu 
    Saturday, 30 April 2011

    E posibil sa fie de la deshidratare/dejectii normale, sigur ca da. Dar se pot parametriza pierderile homeostatice.

    Sau cu alte cuvinte, chestiunea necesita un raspuns, oricum ar fi el.

  13. mitzaabiciclista`s avatar
    13
    mitzaabiciclista 
    Tuesday, 3 May 2011

    # Gheorghe, nu am spus nici o secundă că acei pui ies întotdeauna pe minus şi niciodată pe plus. De ce dramatizezi?
    # Mircea, închipuie că sunt cazuri în care nu se fură. De ce? Pentru că există astfel de sisteme care nu permit furtişagul, asta pe de o parte- pe de altă parte, de ce neapărat trebuie să ne gândim la furtişag?
    Eu vroiam să îţi spun altceva, dar am observat deja că ai concluzionat la penultimul comentariu. Da, media nu este reprezentativă. Desigur că poate fi luată ca punct de reper. Eu aici vroiam să nuanţez. Că media efectuată prin sondaje este o variabilă cu + - erori de abatere.
    Greşelile se fac atunci când sunt luate în calcul ca şi valori de adevăr absolut, acele medii aritmetice rezultate din sondaje aleatorii.

  14. Mircea Popescu`s avatar
    14
    Mircea Popescu 
    Tuesday, 3 May 2011

    Mei, sa nu ne luam mai in serios decit e cazul : eu pot fi oricind de acord ca exista sisteme care in anumite conditii de exploatare ingreuneaza furtisagul, dar nu voi fi niciodata de acord ca ele pur si simplu "nu-l permit". Asa ceva nu-i posibil.

    Singura metoda practica de-a verifica teoria cu eficienta sistemelor respective e sa te asiguri ca diferentele constatate sunt coerente cu o distributie statistica aleatorie. Ai formulele lui Poisson, care n-o muncit bietul degeaba, faci derivatele si vezi.

    Da-n rest, clar ca media prin sondaj are o abatere fata de media reala (a carei amplitudine medie se poate de altfel si calcula - tot Poisson).

Add your cents! »
    If this is your first comment, it will wait to be approved. This usually takes a few hours. Subsequent comments are not delayed.