Flesch Kincaid

Monday, 22 February, Year 2 d.Tr. | Author: Mircea Popescu

Flesch Kincaid este o masura statistica a dificultatii unui text, opera unui oarecare Rudolf Flesch, care-a venit cu teoria interesanta ca pornind de la numarul de silabe si cuvinte care compun un text gramatical complet (adica format dintr-un numar intreg de propozitii) putem calcula un index de dificultate suficient de precis incat sa poata fi folosit predictiv.

Aceasta teorie a fost emisa asupra limbii engleze, dar nu exista in principiu un motiv pentru care ea sa nu fie aplicabila limbii romane. Sigur, nu exista nici vreo dovada ca ar fi in fapt aplicabila, cel putin din cate cunosc eu, in virtutea faptului ca n-a studiat nimeni serios problema.

Pentru limba engleza, formula arata precum urmeaza :

FK = 206.835 - 1.015 x (numarul de cuvinte / numarul de propozitii) - 84.6 x (numarul de silabe / numarul de cuvinte)
(exista si o formula inversa, care estimeaza anul de scolarizare al cititorului caruia i se adreseaza textul, si se bazeaza pe exact aceleasi teorie si masuratori)

Daca in urma aplicarii acestei formule indicele FK al unui text oarecare (in limba engleza) rezulta in jurul valorii de 90, acel text este probabil inteligibil pentru un copil in scoala primara. In jurul valorii de 60, textul va fi probabil inteligibil pentru un copil in gimnaziu. Textele cu un indice de aproximativ 40 se adreseaza elevilor de liceu, iar cele sub 30 studentilor, doctoranzilor, masteranzilor scl.

Dupa cum se vede cu ochiul liber, chiar daca teoria ar fi in principiu aplicabila limbii romane (ceea ce nu-i neaparat o presupunere valida, avand in vedere caracterul flexional care-o deosebeste fundamental de limba engleza), formula ca atare nu va fi in nici un caz aplicabila, ea bazandu-se pe masuratori statistice care sunt cu siguranta invalidate de specificul fondului lexical.

In principiu, pentru a calibra aceasta formula, si a putea purcede astfel la verificarea empirica a teoriei, am avea nevoie de un studiu destul de serios, pe baza unui esantion statistic relevant de elevi si studenti la toate nivelele, 12 clase, 4 ani de facultate, masteranzi si doctoranzi, deci per total 18 bucati. Asta daca facem cu totul abstractie de scoli profesionale, de arte si meserii, academii militare, copii supradotati si cu nevoi speciale, deficienti de auz si asa mai departe.

Dupa care, avand la dispozitie esantioanele respective, de sute ori mii de copii, inmultit cu 18, si de asemenea avand tehnicienii care sa faca masuratorile, si specialistii care sa le centralizeze, putem repeta chestia asta tot de 2-3 ori la cinci ani o data si cam prin 2030 asa vom avea niste indici statistic utilizabili.

Operatiune care nu necesita in principiu altceva decat ce avem deja, si anume, un minister al invatamantului, inspectorate scolare judetene, si clase organizate care sa functioneze dupa un orar previzibil pe de-o parte, si respectiv facultati de sociologie, litere, psihologie, cu programe de cercetare, profesori, doctoranzi si masteranzi aferente lor. Si eventual niste bani.

Sigur, ministrii educatiei sunt mult mai ocupati cu proiecte de anvergura, precum "reformarea invatamantului". Aplicand cu sfintenie principiul lui Peter, toata lumea se va ocupa strict de acele activitati pentru a caror finalizare nu poseda suficienta inteligenta, abilitate si experienta. Nimeni nu se va apuca de chestii pe care le-ar putea chiar duce la bun sfarsit, ca "nu se merita" asa ceva. Ca atare nu avem nici pana astazi indicii calculati, o stare de barbarism destul de trista, avand in vedere ca discutia se invarte in jurul unor teorii emise prin anii '50, adica pe vremea lui Constantin Tanase, ca sa va faceti o idee.

Problema este o problema clasica de infrastructura. Nu poate satucul X sa calculeze ce pagubeste in urma faptului ca nu are sosea adevarata, ci un drum de tara prapadit. Nu doar ca "merge si asa", dar si "asa o fost si pe vremuri si uite ca or trait oameni", si in plus, ce-s toate pretentiile si fumurile astea de orasean. Tot la fel, nu pot spune eu exact ce pierdem noi, cultural vorbind, in urma faptului ca nu avem de fapt o metoda statistica de-a evalua dificultatea unei bucati de text.

Si ca atare, soselele noastre asteapta rabdatoare o noua venire a perioadei feudale, cand vor fi si ele varf al tehnicii, si manualele scolare a doua venire a lui Pestalozzi, ca altceva nu vad ce.

Comments feed : RSS 2.0. Leave your own comment below, or send a trackback.

27 Responses

  1. Am aplicat FK asupra paragrafului 5 si mi-a zis ca are scor 34.5 - eu as fi estimat 40, dar fie. Aplicat asupra 1&2 a reiesit 22.7. Mi se par irelevante, though.

    Ma gandesc ca in limba romana articularea aduce 2-3 litere in plus, adaugarea unor desinente tot pe-acolo, pe scurt gradul de precizie al formulei pastreaza o oarecare relevanta chiar daca degradata de varietatea lungimilor. La fel, si in engleza si in romana grosul cuvintelor se invarte pe la 3-4-6 litere, si putem considera ca un cuvant de 9 litere este la fel de putin comun in ambele.

    Insa : o rafinare de care cred ca are nevoie algoritmul este sa "invete" sa desparta in silabe in limba romana, aici nemaiaplicandu-se nimic de altundeva.

    Oricum problema pare ca este la auditoriu, despre care recent am descoperit (cu ajutorul testelor PISA) ca e cam .. varza. Fara carne. Ciudat cum s-a putut sta in intuneric atatia ani. Eu unul as zice ca o eventuala statistica asupra elevilor patriei ar releva ca nu exista diferente prea mari intre clasa a 10a si anul II licenta, dar astea-s doar presupuneri nefondate. Ce naiba, de aia avem olimpici, ca sa ne uitam la restul de cateva sute de mii de elevi?

  2. Mircea Popescu`s avatar
    2
    Mircea Popescu 
    Monday, 22 February 2010

    Pot sa-ti demonstrez foarte simplu ca relevanta nu se pastreaza observand ca majoritatea formularilor monosilabice de 3 litere (deci, consoana-vocala-consoana) in limba engleza sunt in acelasi timp si cuvinte. Ai aici o lista daca te mana curiozitatea. Situatia se prezinta comparabil, chiar daca intr-o masura mai mica in ce priveste combinatiile de 4 litere.

    Cu alte cuvinte, lexicul comun al limbii engleze este foarte apasat asupra cuvintelor monosilabice si disilabice, rezervand cuvintele multisilabice pentru termeni de arta. Pe de cealalta parte, un cuvant precum "deosebire", care nu-i cine stie ce filosofie, are totusi 5 silabe. Exact atatea cate are si "adelphepothia", de exemplu. "Cinematografului" are 7.

    Cat ce priveste auditoriul, sa ne apere Domnul, ca noi am pierdut carma de ani buni de zile. Nu poci zice decat Ingh! alaturi de Cutitaru. Dar merita totusi observat ca plafonarea (clasa a 2-a de liceu egala cu anul 2 de facultate) denota mai degraba o slabiciune structurala a sistemului educativ, decat a materiei educabile.

  3. Da' indici negativi se egzista?

  4. Mircea Popescu`s avatar
    4
    Mircea Popescu 
    Tuesday, 23 February 2010

    Apai mi se pare ca-n formula respectiva indici relativi nu pot avea sens, da' mai depinde si de limba.

    Edit : Negativi nu relativi, auzi colo.

  5. Cum iti ziceam si la discutia precedenta* rezolvarea problemei sta in niste "query" bine documentate. Sunt de acord cu tine ca nu-i treaba simpla, un binom filolog-inginer bine sedat cu cafele timp de 8 ore ar fi probabil necesar. Dar vorba ceea: nu-i nici dificil, nici urgent.

    * http://blog.adrian.mihalcioiu.ro/2010/politicienii-si-netul.html#comment-1729

  6. Mircea Popescu`s avatar
    6
    Mircea Popescu 
    Tuesday, 23 February 2010

    Ie, imi papa blogul tau un comentariu, frustrare care si dadu nastere articolului de fata. Vaz ca l-ai recuperat.

    Dar nu inteleg de ce insisti ca o singura persoana poate face chestia asta, ca tre' masurata intelegerea copchiilor bre om bun. In afara de cazu' ca dai niste teste in plic unor copii, sa zic 15-20 de minute din ora de romana, cu un text si pe urma cu intrebari care sa verifice ce-or inteles, si centralizezi si procesezi datele astea, cum poti sa scoti indicii ?!

    Tu de exemplu prezumi ca aceasta informatie se afla deja in text, si prelucrand manualele de liceu am obtine functia, dar aceasta presupozitie e falsa. De fapt, principala utilitate a functiei ar fi tocmai sa aflam, intr-un tarziu, dupa 20 de ani de reforme, cat de adecvate sunt manualele ca intreg si partile din ele pe bucati.

  7. Orice copil invata dupa manuale scrise la nivelul lor. Care in Romania nu-s asa de alternative ca-n america. Si nici asa de variate. La final evaluarea evalueaza masura in care cunostinele au fost insusite si nivelul a fost atins. Lecturile suplimentare (recomandate) ar putea eventual creste nivelul fata de manual iar lipsa de lectura a manualului il va reduce. Textele din manual sunt reprezentative pentru nivelul mediu de intelegere al elevilor in acord cu standardele de educatie.

    In timpul vietii omul citeste texte de preferinta pe nivelul lui de intelegere. Statistici la vanzarile de carte ti-ar putea recomanda lucrari numai bune de calibrare.

    In general neintelegerea ta asupra problemei in chestiune vine din faptul ca estimezi in mod gresit elevul ca o imprevizibilitate. In fapt intreg sistemul educational de aici si de aiurea e organizat pentru a oferi in majoritate absoluta cetateni medii si predictibili alaturi de un procent neglijabil de exceptii.

  8. *erata
    lor > lui
    cunostinele > cunostintele

  9. am gasit: ti-o mancat comentariul pentru ca ai folosit cialis.

  10. Mircea Popescu`s avatar
    10
    Mircea Popescu 
    Tuesday, 23 February 2010

    Nici poveste, domn injiner. Ceea ce poate pricepe copilu' la varsta X e o chestie obiectiva, pe care manualul, ca produs sintetic, se poate mula intr-o mai mare sau mai mica masura. Tocmai aia vrem noi sa masuram, si ca atare nu putem porni la drum presupunand ceva despre dansa.

    Nici intr-un caz textele din manual nu sunt in acord cu standardele in raport cu metoda noastra de-a masura, fie si numai in virtutea faptului ca ea fiind creatie noua, nu avea cum face parte din standarde.

    E fals ca statisticile la vanzarile de carte ti-ar putea recomanda asa ceva. Prezumtia ta e a unei piete libere, ceea ce nu se intampla. Cartea se vinde la kilogram, la pachet cu adevarul, si nu se cumpara neaparat in vederea lecturii sau functie de gust (ci intr-o oarecare masura functie de pret).

    Da' ai dreptate cand observi ca eu vreau un sistem educativ care sa se muleze pe elevi, iara nu care sa muleze cetatenii pe dansul. Nu-mi pare ca pe aceasta alegere incape discutie.

    Si daca i-o placut cialis-ul din specialisti, inseamna ca-i cam nefututa bloaga ta, nu te supara.

  11. Apoi tu poti face filozofie sau poti face treaba. Vad ca alegi sa faci filozofie.
    Copilul pricepe ce o citit in manual. Ca dupa aia invata si atata stie.

    In general traiesti cu impresia ca nu exista o metodica si o programa scolara cand de fapt problema e ca nu se prea adapteaza din vremuri de demult. Noi daca vrem sa evaluam cam ce cunostinte lexicale are juniorul mediu la 10 ani luam manualele de clasa a IV si ne lamurim.

    Am presupus ca suntem intelesi asupra ce inseamna vanzare de carte si ne referim la piata libera cat este.

    in ce priveste dorintele tale alea sa vii cand facem o sedinta cu flacara violeta sa le descantec. Nu de alta da-ti incetoseaza intelegerea realitatii care este. Singura care de altfel poate fi masurata.

    Bloaga de wordpress!

  12. Mircea Popescu`s avatar
    12
    Mircea Popescu 
    Tuesday, 23 February 2010

    Lmao.

    Atitudinea asta-i de fapt daca ma gandesc bine mult mai productiva decat gresitele si eroneoasele mele opinii anterioare, pe care le recant cu aceasta ocazie.

    Am vazut lumina beneficiilor majore pe care abordarea propusa de tine le ofera, printre care enumar cateva in ordine aleatorie :
    - eliminarea nevoii sau utilitatii intregii discipline numita UX. Websiturile, interfetele si tot restul sunt bune exact asa cum sunt.
    - ergonomia ca disciplina de studiu devine un fel de metafizica a esteticii, si ca atare poate fi mutata in camara facultatii de filosofie
    - sistemul electoral, greoi si scump asa cum se gaseste el in momentul de fata poate fi cu succes inlocuit cu o metoda obiectiva, realista, stiintifica, prin care sa se masoare diversii alesi in functie la un moment dat, si sa se genereze altii exact dupa chipul si asemanarea lor, doara oamenii au ales fix ce si-or dorit
    - etc scl si altele la fel.

  13. No vezi aici ii durerea noastra a inginerilor de fata cu filozofii:

    Ca noi inginerii zicem ca nu-i buda nicaieri imprejur si calcam in ce cacam si propunem tarii sa desemnam o locatie sa sapam o groapa si locul sa fie inconjurat cu scanduri. Da vin filozofii care vor sa evalueze caz la caz in ce fel influenteza karmic buda nemurirea sufletului. Undeva in manualele de filozofie ar trebui sa fie permisa si evolutia industriala.

    In toate cazurile de fata tu propui o solutie care ne lasa indefinit fara indexi pe motiv ca nu-i cu cine in comparatie cu o solutie imperfecta dar disponibila necesitatilor noastre. Cam cum fac parazitii aia verzi de le cer africanilor daca vor agricultura sa alimenteze tractoarele numai cu energie solara ca petrolul polueaza.

  14. Mircea Popescu`s avatar
    14
    Mircea Popescu 
    Tuesday, 23 February 2010

    Lol da' fa-o ma! Te impiedic io s-o faci ? Fa-o linistit.

    Si io ti-oi spune de ce nu-i buna, cand esti gata. Bine ?

    Pe locuri, fiti gata...

  15. De specialisti sa spuna de ce nu-i buna una si alta e plina tara. Aferim!

  16. Mircea Popescu`s avatar
    16
    Mircea Popescu 
    Tuesday, 23 February 2010

    Lmao ce discurs de piarista ai mai nou bre, nu-i de inchipuit.

  17. Apoi de la tine probabil chiar asa pare. Da nu pricep de la ce te-ai incins. Doara nu de la dialogul cu Narcisa ?

  18. Mircea Popescu`s avatar
    18
    Mircea Popescu 
    Tuesday, 23 February 2010

    Da' nu m-am incins, numa sed si ma scarpin in cap... asta vrea sa isi traga apa in casa, cum au si altii prin alte parti. Foarte bine. Da' vrea sa-si traga apa cu o sfoara de canepa, pe care sa curga picurand, asa... si ce-am io sa ma pun in calea progresului lui material si cultural ?!

    Ce poci si sa mai zici, ca cruce n-am voie sa-mi fac ca am pus ramasag cu grid care-si tine respiratia mai mult castiga.

  19. Apoi si tu sugerezi sa astepte pana la anu cand vin tevile alea de PVC ?

  20. Mircea Popescu`s avatar
    20
    Mircea Popescu 
    Tuesday, 23 February 2010

    Da. Suntem prea saraci ca sa aplicam solutii proaste.

  21. ... as a scientist
    Too

  22. Mircea Popescu`s avatar
    22
    Mircea Popescu 
    Thursday, 12 April 2012

    Pentru curiozitate, ca tot discutam tema generala a troglodirii, uite cum arata documentarea englezilor : http://hansard.millbanksystems.com/

    Discursuri tinute in Parlament acum doua sute de ani ? Complete, si indexate. Un proiect care n-a costat en milioane de euro ca sa-si poata face familia Simion una-alta prin batatura.

  1. [...] Ghana si tot ce mai doriti dumneavoastra, dar nu pentru Romania. Ca asa suntem noi, precum am mai spus si precum am si ramas. Am folosit ca atare media din Alpii Dinarici, pe teoria ca tre’ sa [...]

  2. [...] a le aplica romanilor, dar in lipsa unui studiu nu avem pe ce sa ne bazam. Suntem ingrozitor de in urma la studii, apropo, avem o groaza de studenti la comunicare si absolut zero rezultate stiintifice. Eu [...]

  3. [...] industriei. Deocamdata nu am primit cereri, chestie care pina la urma nici nu ma mira, dat fiind ca Flesch Kincaid tot nu avem. Poate in zece-douazeci de ani asa (revin si repet : fata de vasta incompetenta a fiecarui roman la [...]

  4. [...] si sa subliniez ca intr-o tara, intr-o limba si intr-o cultura in care nu exista un prapadit de Flesch-Kincaid nimeni nu are dreptul sa se declare sociolog, nici doctor in sociologie, nici masterand in [...]

  5. [...] controlat artificial pentru a-l favoriza. Experienta facuta competent (adica de mine, ca altcineva nu este cine in Romania) si pe bani (ai mei, bineinteles, ca tot restul romanilor sunt niste saraci). Experienta [...]

Add your cents! »
    If this is your first comment, it will wait to be approved. This usually takes a few hours. Subsequent comments are not delayed.