Cam despre ce se scrie in blogosfera, rezultatele.

Wednesday, 04 January, Year 4 d.Tr. | Author: Mircea Popescu

Explicam la articolul precedent ce ma apuc sa fac.

Rezultatele inseamna 7`892`221 linii, 18`167`086 cuvinte si 171`444`251 caracterei din articole publicate respectiv 18`956`801 linii, 41`818`912 cuvinte si 404`165`267 caractere din articole introduse (dar nepublicate). Ele au fost filtrate din ~ 2Gb de html brut, intreaga procesare durind cam 20 de minute.

Le puteti admira dinjos (pozitiile au fost normalizate dupa numarul total de cuvinte) :

de(23`536,08 de(22`061,91)
si(14`108,54) si(13`265,41), in(12`626,06)
in(12`428,69), sa(10`459,91), la(10`334,18) la(10`065,64), sa(9`850,21), a(8`551,20)
ca(8`482,43), a(8`113,13) ca(8`083,38), cu(7`830,72)
cu(7`780,33), nu(7`591,31) nu(7`335,15)
pe(6`813,15), mai(6`675,53) mai(6`381,01), pe(6`359,97)
o(6`057,27) o(5`484,89)
un(5`069,39), care(4`775,50) un(4`694,77), care(4`640,20)
din(4`332,51) din(4`257,57)
2010(4`095,04) 2010(3`912,25)
am(3`885,21), 2011(3`869,42), se(3`834,96) se(3`701,55)
ce(3`696,47), pentru(3`630,91) ce(3`565,42), pentru(3`539,91))
e(3`340,16) am(3`301,81), e(3`136,43), 2011(2`884,58)
este(2`404,24) este(2`344,97)
raspunde(2`267,73) 2009(2`209,86)
2009(2`194,63<), ma(2`093,62), sunt(2`091,42), sau(2`088,17) sau(2`035,23)
dar(1`983,75), blog(1`931,68) sunt(1`914,66)
prin(1`896,07), daca(1`763,30) dar(1`758,68), ma(1`751,72), blog(1`729,62)
fi(1`691,41) daca(1`689,79), fi(1`641,94)
cum(1`625,91), eu(1`609,06) va(1`571,37)
va(1`570,70) cum(1`548,39), urma(1`489,16), au(1`417,40), eu(1`416,58)
despre(1`413,88), cand(1`401,27) normal(1`396,71)
te(1`377,71) raspunde(1`362,66)
au(1`357,56) despre(1`346,97), lui(1`335,14)
asta(1`328,06), ai(1`311,27) asta(1`291,04)
lui(1`284,30) fost(1`265,48), prin(1`228,82), cand(1`228,25)
fost(1`199,97) te(1`196,04), ai(1`174,49)
ne(1`163,97), asa(1`142,40), urma(1`105,57) li(1`087,07)
are(1`085,53) august(1`083,43)
și(1`081,85), bine(1`081,57), poate(1`072,93) ne(1`067,29), are(1`065,07), of(1`063,56), al(1`056,89)
al(1`054,27), li(1`042,10), ianuarie(1`030,27), of(1`025,48), mult(1`024,93), tot(1`015,79), normal(1`009,79) asa(1`008,61)
decembrie(982,66) poate(973,17), și(957,87)
ar(937,41), doar(937,13) ar(931,01)
august(917,37) dupa(909,99)
dupa(901,52) bine(899,69), tot(896,15), mult(879,48)
ani(875,04) decembrie(868,77)
imi(865,96), le(863,26) el(855,50)
nici(846,26) doar(844,69)
fara(840,15) ani(834,07)
noi(826,82), el(813,83), chiar(806,62), noiembrie(800,79) nici(796,29), le(783,55), noi(781,51)
februarie(776,40) fara(769,99)
aici(761,16), ei(757,03) romania(754,97)
cristian(751,03), iar(734,02) i(732,92), ianuarie(731,85), acum(717,50), octombrie(714,70))
comentarii(712,72) imi(710,32)
toate(705,78), comentariu(704,46), acum(704,02), cel(698,90), martie(694,06) chiar(692,06), ei(690,21)
ceva(689,21) iar(688,13)
romania(688,11), foarte(684,86), octombrie(682,50), viata(682,11), cat(676,61), da(672,26), fie(672,04) da(669,41), ceva(667,52)
mea(661,64) cel(649,23)
face(647,21) face(646,74)
mare(642,70), ii(642,26), iti(634,28) toate(632,92), noiembrie(629,50)
cei(627,29) acest(623,78), comentarii(622,97), aici(622,35)
i(622,33), era(622,28), mine(616,55) fie(615,61)
cele(615,45), septembrie(614,85) cei(613,14), ii(608,94), septembrie(608,50), foarte(608,36), iunie(606,14), mare(605,61)
zi(603,12) martie(601,59)
tu(598,44) trebuie(593,80)
cred(590,96), pana(588,92) aprilie(583,21), dat(582,77)
trebuie(576,92), decat(574,23))
dat(570,15) 2008(565,87)
acest(565,64) cred(562,90), spunea(554,06), era(552,79))
aprilie(550,17) pana(548,24)
il(544,61) viata(544,06), mea(539,37)
unde(539,05), pot(538,28), iulie(534,59), timp(531,84), iunie(531,18) tu(530,65)
multe(528,81) iti(527,99), februarie(527,80), mine(527,23), zi(527,18), decat(525,17)
tine(523,14), an(521,33), meu(520,78) cele(519,81), an(518,74), iulie(518,28), 2012(513,98)
stiu(513,46), prea(506,85) unde(503,27), pot(492,72), il(487,32)
spune(487,25) vor(481,50)
atunci(480,70) important(478,71), cristian(476,63), multe(472,70), stiu(471,75), spune(470,03), as(469,91)
as(468,26) timp(466,06)
2008(465,07), facut(462,04)
fac(458,80), lisandru(458,52), multi(454,56), fata(454,23), lumea(452,25), doua(450,82), facut(448,6), vor(443,49), lor(442,12), fiecare(442,01) fac(437,29), prea(436,96), meu(436,36))
dintre(435,29) atunci(433,37), ale(433,34), is(432,99)
ale(432,38) multi(431,50), tine(430,24), doua(429,64)
buna(429,62), voi(428,47) fata(425,19)
important(424,12), multumesc(420,49), spunea(416,91), aceasta(416,47), atat(410,74) lor(409,77)
ea(407,83) aceasta(407,59)
unui(406,34), blogul(405,73), esti(402,27), ori(399,51), intre(399,18), zile(398,85), peste(398,52), nume(393,68), fel(392,03), tau(391,42), 2012(391,42<), bun(387,07) dintre(385,90)
numai(383,06), insa(380,85), ceea(379,42) esti(376,27)
oameni(373,97) luni(371,39)
isi(371,11) oameni(370,79), cine(369,95)
mircea(369,79), nimic(369,68), inca(369,02) peste(367,25), fel(365,70), buna(364,24)
exista(364,06), scris(364,01) ore(363,42), fiecare(357,42), lumea(357,37), bun(356,94), intre(356,70), inca(355,70), numai(353,81)
cea(352,84), putin(352,67) isi(352,47)
avea(351,85), mi(351,46), popescu(351,18) atat(350,77)
cine(348,27), mam(345,74) site(344,53), exista(344,51), blogger(343,27)
alte(342,65), is(341,28), spus(341,00) nimic(340,13)
putea(339,35) ceea(337,29)
ta(336,93), cultura(336,49) putin(334,75), ea(334,68), blogul(333,99), insa(333,27), ori(332,94)
fotografie(330,05) nou(329,68), alte(329,54)
orice(329,06) putea(329,04)
pare(328,56) cea(327,89)
spre(327,19) comentariu(324,28)
pagina(324,05), cuvinte(323,88) avea(323,47)
adresa(322,40) facebook(321,65)
luni(320,03), eee(319,59), unei(316,40), facebook(316,29), mie(315,96) spus(315,38), site(313,09), andrei(312,38), online(311,18), tau(310,00), or(309,55), cultura(307,66), orice(307,61)
acolo(307,04) georgia(306,73), scris(306,66)
click(305,99), frumos(305,72), lasa(305,00) pare(304,55)
), poti(301,70), mia(298,67), teo(296,08), toti(295,97), parte(295,81) sub(295,03)
maria(293,44), sub(292,73), articole(292,01), or(290,91) mi(290,49), unei(290,25), andrei(289,18)
nou(289,09) mam(288,94)
cam(286,89), mele(286,89) poti(286,76), ia(286,59), toti(286,47)
alta(286,34) bani(285,59)
ci(285,57) pagina(283,20)
niste(282,82) acolo(282,77)
articol(282,43), cateva(282,38) avut(281,40)
loc(280,89) nume(279,78), niste(279,61)
toata(279,35), prima(279,08), alex(278,25<), bune(277,98) tara(277,75)
luna(277,42) text(276,31), parte(275,83), ci(275,52))
vad(275,28), avut(274,84), spun(274,34), ore(274,01), unul(272,25) spre(271,89), catre(271,34)
blogger(271,31) click(271,12)
twitter(270,98) alta(270,55)
copii(269,77), deci(269,77), om(269,11) prima(268,56)
ia(268,23), concurs(267,74) intrun(267,49)
foto(266,91) lisandru(266,63), mie(265,81), twitter(264,45)
vazut(264,16) cam(264,07), ta(263,42)
dan(262,78), dea(261,90) basescu(261,03), aia(259,74), val(259,17)
ziua(258,76) cateva(258,50)
apoi(257,72), mihai(257,28), lume(257,17), necesar(256,34) politica(255,67), loc(255,65)
sai(255,52) deci(255,36), fix(254,98), dan(254,77)
bani(254,03), faci(253,98), ales(253,76) noua(252,92), ziua(252,88), unul(252,42)
catre(251,94), noua(251,28) toata(251,23)
web(250,84), una(250,84) eee(249,77), faci(249,15), vad(247,28), spun(247,26)
muzica(246,38) om(245,80)
astfel(245,11) anul(243,91), saptamana(243,41)
primul(243,08) cuvinte(243,05)
gabriela(242,80) una(242,14), multumesc(241,52)
aia(240,60) vazut(240,54)
tara(239,88) web(239,15)
via(237,52) lasa(237,50<), 2007(237,17), ora(236,11), casa(235,28), articole(235,09)
macar(234,43) dea(234,42)
film(234,27), casa(233,00) sai(232,77)
vorba(231,90), vreau(231,79) bucuresti(231,45)
inceput(231,13) avem(231,12)
vezi(230,86), dau(230,69) vezi(230,42)
nui(229,65) mia(229,37), mircea(229,23), astfel(229,15)
tare(228,77), teonegura(228,21) vorba(227,24)
carti(227,11), niciodata(226,29) postare(226,17)
suntem(225,90), azi(225,52), aproape(225,46) vrea(225,21)
avem(224,97) ales(224,73), azi(224,28)
vrea(223,81), cineva(223,48) vreau(223,46)
nam(223,26), totul(223,04), adrian(222,99) apoi(222,87)
ganduri(222,82) copii(222,82)
raspuns(222,49) luna(222,48), inceput(222,00)
suflet(220,67), anul(220,01), text(218,86), timpul(218,64) dau(218,61)
bucuresti(218,58) adresa(218,51)
nimeni(218,31), mari(217,81) ie(217,60), suntem(216,70)
anuleaza(215,06), frumoasa(214,95), nevoie(214,78), saptamana(214,51) filme(213,97)
zic(213,52), trebui(213,19) macar(212,77), muzica(212,63)
seara(212,58), sati(212,25), doi(212,03) trebui(210,84)
carte(210,82), filme(210,27), hai(210,05) faca(209,98)
ochii(209,77), ora(209,72), georgia(209,50) lume(209,43), frumos(209,12)
oamenii(208,07), sal(207,57), rau(207,13), celor(206,64) articol(206,06)
faca(206,03), negura(205,32) celor(204,84)
deja(204,11) lucru(204,09)
vrei(204,00), politica(203,67), fotografii(203,50) scpt(203,50), cineva(203,28)
stii(202,95), sami(202,51), vine(202,23), poveste(201,68), ele(201,68) craciun(201,32)
trecut(201,30), inainte(201,24) bune(201,11), no(200,63), rau(200,41), mihai(200,10)
craciun(199,98), greu(199,54) nimeni(199,22), tare(198,95), sal(198,79)
citit(198,77) oamenii(198,55)
lucru(198,55) roman(198,47), nevoie(198,31), saptamani(198,16), partea(197,97), zic(197,95), nui(197,76)
inseamna(197,61) nam(197,47), zice(197,45)
cate(197,33) live(197,16), media(197,02), primul(196,87)
dima(196,56), fapt(196,01), simplu(195,79), vis(195,57) trecut(195,39), adrian(195,08)
vreo(194,53) totul(194,41)
scrie(194,20) mele(194,17)
singura(194,14), recente(193,98), ajuns(193,92), totusi(192,71), val(192,66), calin(192,55), zis(192,44), sus(192,11), acasa(192,11) deja(191,78), inainte(191,54), foto(189,29), niciodata(188,43), doi(188,24), ajuns(187,88)
venit(187,43), elena(186,93) aproape(186,73), timpul(186,71)
mana(186,66), partea(186,66), proza(185,89), roman(185,78), geanina(185,34) cate(185,23), fapt(184,94)
placut(184,56), mereu(184,18) adica(183,98)
dumnezeu(183,79), probabil(183,79), simt(183,08), iubire(182,75) mari(182,05), zis(181,90)
desi(181,76), poezie(181,43) euro(181,28)
2007(181,15) vine(180,90)
no(180,60) inseamna(180,47)
comentariul(180,16) problema(179,37), scrie(179,23)
altfel(179,01), unii(178,89) ), probabil(177,43), acasa(177,26), alex(177,05), necesar(176,45)
multa(176,31), adica(176,31) faptul(176,26), stii(176,16), vrei(175,52), vreo(175,33)
povesti(175,04) raspuns(174,94)
trei(174,60) sati(174,47), google(174,30), just(174,18), greu(173,80)
bucur(173,39), langa(172,95) video(172,03)
pai(171,24), parca(171,24) so(171,05), stie(171,00)
wordpress(170,80), basescu(170,64) totusi(170,45)
printre(170,36) venit(170,33), sami(170,31)
hera(170,14) ele(169,73), aceste(169,52), desi(169,49)
postare(169,26), stie(169,15) fiind(169,01), trei(168,80), via(168,54)
scriu(167,83) film(167,79)
doresc(167,56) tv(166,50), unii(166,19)
unor(166,07), doina(165,96) altfel(165,93)
ioan(164,97), fotografiile(164,86) stiri(164,45), simplu(164,38)
faptul(164,31) ati(164,18)
aceste(163,92), noapte(163,37), problema(163,04), acesta(162,82) wordpress(162,53)
saptamani(162,27) sus(162,15)
erau(161,78) mana(161,75), hai(161,29)
carmen(161,28), adevarat(161,01) acesta(160,81), persoane(160,79)
sigur(160,73), fii(160,34), carti(159,57)
bloguri(159,52) seara(159,45), unor(158,49)
cap(157,59), nea(157,37), trafic(157,15) dumnezeu(156,80)
subcategorie(156,77), mei(156,66), persoane(156,55) cap(156,46), simt(156,08), fii(155,91)
stiri(155,83), jos(155,01) luat(154,95)
draga(154,95), povestea(154,95), media(154,68), miam(154,68), zice(154,51), dragoste(154,46) scriu(154,26), singura(154,16)
google(153,79), apa(153,41) sar(153,11), erau(153,11), citit(152,11), langa(151,56), radu(151,56), ganduri(151,49)
concursul(151,21) carte(151,10), pai(150,12)
lucruri(150,00), citesc(149,94), mama(149,12), introdu(149,12), vreme(148,46), noastra(148,35) arhiva(148,00)
trimite(147,96), luat(147,02), folosind(146,58) altii(146,35)
sar(146,09) ioan(145,72), munca(145,68), etc(145,39)
sufletul(145,10) internet(144,91)
ati(144,60), moment(144,16), utilizator(144,11) cazul(143,93), jos(143,86)
castigatoare(143,56), oricum(143,50) seama(143,48)
posturi(143,17), mazilu(143,12), uneori(143,06), ultima(142,73) adevarat(142,57)
comentezi(142,51), seama(142,35), omul(142,24) noastra(142,18)
iarna(141,96) locul(141,92)
lam(141,79) ultima(141,68), printre(141,32), romaniei(141,28)
blogroll(141,19) lucruri(141,16)
altii(141,13), sper(140,69), bogdan(140,58) criza(140,56), oricum(140,25), romani(140,18)
vin(140,09) moment(139,58), ala(139,36)
noaptea(139,32), departe(139,21) vin(139,17)
astazi(139,15), cartea(138,88), cati(138,88) sigur(138,79)
eram(138,49), bloguieste(138,33) bogdan(138,21)
iubesc(138,16) maria(137,98), cauta(137,81), plus(137,59)
tale(137,45), drept(137,17) multa(136,80)
locul(136,73), cazul(136,51), sasi(136,40), arta(136,35), vedere(136,29), acelasi(136,24), dai(135,91), tocmai(135,80), amintiri(135,63) frumoasa(135,11)
lumii(134,86) doresc(134,82)
usor(134,80) personal(134,72), dai(134,72)
vechi(134,69) vom(134,65)
fiu(134,53), dimineata(134,42), vom(134,36), romani(134,14), femeie(133,70), inteleg(133,65), facem(133,48), intampla(133,15) suflet(132,83)
femei(132,82) vedere(132,81)
literatura(132,27) mama(132,09)
ala(132,00) omul(131,88)
etc(131,78), munca(131,50), viitoarele(131,28) drept(131,02)
astea(130,95) astazi(130,90)
pus(130,90) acelasi(130,85)
aparute(130,84) zilei(130,61), veche(130,56), bloguri(130,23), pus(129,97)
tv(129,91) facem(129,75)
incat(129,52) afara(129,37), sasi(129,30), elena(129,25)
afara(128,97), publicat(128,91) astea(128,84)
singur(128,75), blogosfera(128,75) lam(128,67), popescu(128,65)
vei(128,47) miam(128,46)
mic(128,14) mereu(128,10), comentariul(127,72), blogroll(127,55)
aceea(127,54), video(127,48) marius(127,38), parca(127,26)
arhiva(127,10), zilei(126,71), ceai(126,00), ideea(126,00), plus(125,56) asupra(125,33)
stat(125,12) sper(124,94)
noastre(124,84), ie(124,84) vreme(124,78), citesc(124,68), intampla(124,66), general(124,39), placut(124,39)
usca(124,24), mirari(124,24) departe(123,92), concurs(123,77)
destul(123,74) presa(123,70)
tuturor(123,69) asemenea(123,37)
cauta(123,35) usor(123,27)
numele(123,24) ochii(123,03), apa(123,03)
soare(122,86) social(122,70), recente(122,70)
pur(122,53) cauza(122,05)
cenusa(121,98), mica(121,81) publicat(121,67), bucur(121,64)
design(121,54), romanul(121,43), asemenea(121,43), uite(121,43) geanina(121,40)
gura(121,32), euro(121,10) gabriela(120,97)
cer(120,88) poezie(120,73), numele(120,40), banii(120,26)
iubirea(120,16), prieteni(120,05) poveste(119,99), inteleg(119,85), destul(119,78), iau(119,61)
neam(119,56) treaba(119,32)
exact(119,06), putem(119,06), numi(118,95) fiu(118,37)
website(118,35), articolul(118,35), merita(118,24) mic(118,22), rog(117,87)
masina(117,85), imagini(117,85), mici(117,80), sex(117,74) nea(117,60), sia(117,32)
ochi(117,30) masina(117,22)
ana(116,80), precum(116,75), exemplu(116,69), cauza(116,42), categorii(116,25), pune(116,14) putem(116,14), draga(116,07)
marius(115,81) ideea(115,40)
alina(115,37), arata(115,32), treaba(114,99), dreptate(114,60) romana(114,35)
frumoase(114,33) eram(114,02), george(114,02)
george(113,89), gasit(113,67) arata(113,63)
dor(113,61) io(113,01)
lumina(112,95), romana(112,90) singur(112,89)
asupra(112,79) scoala(112,70)
iau(112,68), lucrurile(112,57), editia(112,51) pune(112,29), aceeasi(112,27), aceea(112,22)
criza(112,07), veche(112,02), unele(111,96) vina(111,74), articolul(111,70)
intra(111,52) prost(111,50), arta(111,43), precum(111,41), iubire(111,24), ion(111,19)
perioada(111,14) design(111,00), exact(110,88)
utopia(110,86), paul(110,80) femei(110,76<), ba(110,72), tocmai(110,52), vei(110,48), traian(110,40), minute(110,24)
tema(110,20) adevarul(110,17), aveti(110,17), mici(110,02), perioada(109,93), merge(109,76)
vara(109,70) sarbatori(109,62), limba(109,54), dreptate(109,52)
vina(109,43), interviu(109,37), io(109,32) exemplu(109,28), mica(109,04), povestea(108,83)
copiii(108,49), alaturi(108,44), sia(108,44), internet(108,38) tuturor(108,37)
minute(108,22), copil(108,16), afla(108,16), gandesc(108,11), ba(108,00) lista(107,80), dimineata(107,68)
scoala(107,45), drag(107,28) nostru(107,27), noastre(107,25), afla(107,18)
odata(107,17) na(107,13), lucrurile(107,08)
autor(107,06) vechi(107,06)
personal(107,01), radio(106,95), dincolo(106,95), arhiscurta(106,90), florin(106,84), na(106,62) sanatate(106,44)
hituri(106,40) noaptea(106,36), public(106,32), noapte(106,32)
cristi(106,29), nostru(106,24), jurnal(106,18) lumii(106,17), idei(106,15)
ramas(105,96) mei(105,93)
clar(105,91) produs(105,81)
fiindca(105,80), prost(105,58), diana(105,41), pauri(105,30), drum(105,19), astept(104,97), vietii(104,86), gabi(104,86) neam(104,86)
alexandru(104,75) schimb(104,64)
public(104,64) poze(104,52)
fotografia(104,42), flux(104,31) tale(104,14)
spui(104,03), aceeasi(103,87) iarna(103,83)
lista(103,81) gura(103,80), lei(103,76), diverse(103,54), imagini(103,45)
dulce(103,37), merge(103,26), felul(103,26) iubesc(103,25)
banii(103,10), duminica(103,10), aveti(103,04), general(102,99), succes(102,93), romaniei(102,93), limba(102,93) numi(102,90)
parerea(102,71) ionut(102,56)
adevarul(102,55), impreuna(102,49), probleme(102,33) incat(102,27)
rand(102,16), tie(102,16), inima(102,00), ionut(101,94), barbat(101,94) merita(101,37)
toamna(101,01), razvan(100,95) dragoste(100,77), uite(100,72), trimite(100,72), acord(100,60), succes(100,58)
sanatate(100,46) ramas(100,43)
catalin(100,35), radu(100,29) povesti(99,91), cind(99,81)

    In paranteza se afla frecventa (exprimata in aparitii per milion). Am parcurs tabela manual stergind diverse elemente care evident nu-si au locul (ca de exemplu semnul =, cuvintul "comment" si variante, numele lunilor in limba engleza, diverse scapari din mark-up scl).

    De-aici incepe partea a doua, in care mintile agere de pe margine fac observatii remarcabile pe baza datelor publicate. Sunt chiar curios ce iese din asta.

    PS. Evident a trebuit si sa inlocuiesc mizeriile de diacritice. Sunt cam singurul din Romania capabil sa ofere o statistica pe tema raspindirii respectivei timpenii, si iata c-am s-o si ofer :

    • 151489 si vs. 104770 şi (0.6916)
    • 122315 in vs. 86325 în (0.7057)
    • 105509 sa vs. 64270 să (0.6091)
    • si asa mai departe.

    Asa ca mai sugeti o ceapa, Internetul romanesc NU scrie cu diacritice. Ciudatii care o fac sunt o subcultura (si-s ridicoli).

    PPS. Daca aveti curiozitati tehnologice,

    sed -n '/^$/!{s/<[^>]*>//g;p;}' links.txt

    respectiv

    PUNCT=";:,._&#)(!{}><\~"
    awk '{for(x=1;$x;++x)print $x}' "${1}" | tr "${PUNCT}" "@" | sed 's/@//g' | sort | uniq -c | sort -nr

    ———
    1. Revin 9.43 litere in cuvintul mediu in primul caz si 9.66 in al doilea, dar valoarea este umflata pina la inutilitate de prezenta a tot felul de mizerii scapate n-am prea inteles cum din mark-up. []
    Category: Meta psihoza
    Comments feed : RSS 2.0. Leave your own comment below, or send a trackback.

    14 Responses

    1. Iti dai seama cate posturi poti scrie exclusiv din prepozitii? Desigur, spammerii au de multa vreme propria nisa bazata pe cuvinte fara legatura :P

    2. Sî ti piş în freză, creţule, eu scriu cu diacritice şi-s mândru de asta. Ţi-ar lua probabil 2 săptămâni de exerciţiu maxim să înveţi să scrii cu diacritice în exact acelaşi ritm în care scrii fără. Şi, la o adică, mi se fâlfâie (falfaie, uratule) că tu scrii fără, da ce treabă ai tu că eu şi comunitatea mea de ochelarişti ciudaţi scriem cu?
      Puţă rasistă, asta eşti. :P

    3. Mă Mircea, nici pixul nu are diacritice .

      Chiar că eşti o puţă rasistă.:-)

    4. Mircea Popescu`s avatar
      4
      Mircea Popescu 
      Wednesday, 4 January 2012

      @krossfire Chiar ar fi un exercitiu interesant asta, "scrieti un articol fara substantive sau verbe" gen. Da' sa aiba sens.

      @cosminmaricari Toti ciudatii is mindri de ciudatenia lor, laissez, nu-i ceva nou. Si tie ti-ar lua probabil 2 ore maximum sa te dezobisnuiesti de timpenie, asa cum i-ar lua oricarei pizde emo doua ore sa se spele de cacaturi si sa redevina futabila. Da' nu, ca ea-i mindra ca-i proasta si nefe.

      @Meneopol Gura bai ciorilor!11

    5. Din câte observ, cam 40% din utilizatori folosesc diacritice. Cifra nu reprezintă o majoritate, dar nu e nici de lepădat. De fapt nici măcar nu i-ai putea acuza de elitism (fals) pe cei care folosesc, pur și simplu e o chestie de opțiune.

      Cu atât mai mult cu cât browserele și Interneții în general n-ar trebui să aibă treabă cu encoding-urile în ziua de azi.

    6. Mircea Popescu`s avatar
      6
      Mircea Popescu 
      Thursday, 5 January 2012

      Haidi bre, n-ar trebui sa aiba.

      Ca sa ne lamurim ce discutam : scrisul cu diacritice e o prostie. Chestia asta am aratat-o deja, ea nu se mai gaseste la nivelul discutiilor, optiunilor, bla bla. Proponentii prostiei respective sustineau in mod eronat ca ea este majoritara, de parca asa ceva ar schimba ceva. Tocmai ce s-a vadit ca nu-i nici macar majoritara. Sfirsitul discutiei, pe bune, e o prostie minoritara ca alte o suta si-o mie, nici nu mai merita discutata ca atare, cum nu merita discutat daca sa ne bagam tinte-n pleoape sau ce pleazna nastrusnicii de-astea.

    7. Problema existenţei acestor caractere în limbă s-a tranşat pe la comentariile 44-45 în articolul "De ce nu folosesc", dacă nu mă înşeală linkul. Sau mă rog, s-a tranşat în sensul în care tu o ţii pe-a ta şi restul lumii pe-a ei, şi momentan restul lumii câştigă. Au renunţat nemţii şi restul trupei la a scrie cu diacriticele proprii pe internet? Chiar m-ar interesa un studiu serios pe tema asta, dacă există.

      Soluţia propusă de tine în articolul "Hai să ne agităm" nu-i o soluţie. Observi corect că notaţia limbii române e ambiguă, şi apoi propui să o facem şi mai ambiguă. Dai exemple de vorbitori confuzi care nu ştiu a folosi limba, şi propui eliminarea şi cârjelor care există. Procentul utilizării caracterelor diacritice creşte încet-încet de ani buni, iar acolo unde ele nu există vorbitorii tind să le înlocuiasă cu grupuri de genul "sh" sau "tz". Pare rău, da' mie-mi pare că lucrurile ar funcţiona mai bine prin introducerea de caractere noi, nu eliminarea lor. Dar şi asta s-a răs-discutat.

      Oricum, asta nu este o chestiune de majoritate simplă, e o chestiune de preponderenţă culturală. Textele oficiale şi textele literare se scriu covârşitor într-un anume fel, şi anume cu caractere speciale. E o prostie? Bagă mare, dovedeşte-o ca prostie în practică. Dacă Trilema este singura sursă de cultură în online-ul românesc, cum ai propus adesea, înseamnă că va acţiona ca motor de tracţiune şi va conduce la eliminarea caracterelor de acest gen. Zic să repeţi statistica de pe /fain şi anul viitor, vedem ce iese.

    8. Mircea Popescu`s avatar
      8
      Mircea Popescu 
      Thursday, 5 January 2012

      Zic ca te inseala link-ul, eu ziceam de evrei, eh ? In tot cazul, nu mi-e clar ce cistiga daca dupa fo' zece ani de scremete inca n-au atins majoritatea. Zic ca-ti poti face un studiu relativ simplu : cauta ß.

      Eu am aratat atit : ca cei care sustin ca fac o chestie azi scriind cu diacritice nu o fac de fapt. Intre a face ceva pe jumatate si a nu face deloc e preferabil sa nu facem deloc. Chiar si daca facem gresit ce n-ar trebui sa facem, adica pe jumatate, nu-i la latitudinea noastra sa nu recunoastem evidenta (ca o facem de jumatate). Eventual am mai aratat si ca "ambiguitatea" ceea ori nu exista ca atare ori nu strica nimic, si deci e o perdea de fum in discutie.

      Iti atrag numa' atit atentia, ca n-au trecut inca cincizeci de ani de cind "textele oficiale si textele literare (cum numesti mai generos decit e cazul niste chestii care de fapt nu prea exista)" se publicau cu poza lu' tovarasu-n fata. Stii care tovarasu' ? Tovarasul Secretar General al Partidului Comunist Roman, Tovarasul Nicolae Ceausescu. Sau cu alte cuvinte ca s-ar putea sa nu conteze nici de cinci minute cum se scriu "textele oficiale".

    9. Mie-mi pare că aşa: spaţiul sunetelor este unul foarte larg, în vreme ce combinaţiile de 2-3 litere pe care le putem inventa pentru a le reprezenta sunt în general reduse, mai ales dacă te rezumi strict la alfabetul latin.

      Faţă cu atare problemă, cei ce încearcă să pună în scris diverse limbi au a inventa litere, ca necesitate mult dinaintea internetului. Necesitatea variază în timp ca funcţie a corpusului de sunete care compun cuvintele în limbă, ceea ce în practică ne dă ß Ä Ö în germană, è é æ Â în franceză, ñ ó á în spaniolă, ç ğ İ în turcă, ę š č ú în ceho-slovacă etc ad nauseam.

      Intre a face ceva pe jumatate si a nu face deloc e preferabil sa nu facem deloc

      Problema este bineînţeles că în cazul limbilor este cvasi-imposibil să faci treaba complet, i.e. să descrii complet toate sunetele existente în limbă prin grupuri de sunete.

      Se poate în felul pe care-l propui tu, supraîncărcarea sensului unor grafeme (şi grupuri de grafeme) existente. Avem însă un exemplu de limbă care practică această supraîncărcare, engleza. Una din cele mai cunoscute plângeri asupra ei este că .. drumroll .. nu-i clar niciodată cum trebuie citit un anume cuvânt. Ceea ce practic reduce o bună parte a procesului învăţării de vocabular la o memorare pe de rost a pronunţiei.

      Dacă poţi să inventezi un set de reguli lipsite de ambiguitate prin care să eliminăm diacriticele din româneşte şi care să elimine neclarităţile asupra pronunţiei* ... chiar îs curios. Eu unul am încercat ca exerciţiu să inventez o scriere complet ne-ambiguă pentru română, însă sunt prea multe suprapuneri cu sensurile deja-existente la alăturări; nu găsesc suficiente grupuri de litere prin care să descarc de dublu-sens grafemele existente.

      * Dacă nu poţi elimina complet neclarităţile atunci mai bine nu faci treaba pe jumatate, am I gettin this right? Măcar dacă laşi lucrurile aşa cum sunt există avantajul tradiţiei care funcţionează prin inerţie.

    10. Mircea Popescu`s avatar
      10
      Mircea Popescu 
      Thursday, 5 January 2012

      Mei, uite care-i chestia : latinii, un popor de real succes, au inventat un alfabet. Acest alfabet le-a fost lor suficient pentru a domina lumea cunoscuta, pentru a realiza apeducte fara motoare cu ardere interna sau electrice mai repede decit realizeaza romanii autostrazi, pentru a scrie codurile de legi si alte asemenea de pe care invatam si astazi, umili si incompetenti discipoli.

      Toti putoii, de la turci la francezi si de la suedezi la sicilieni folosesc literele latine, carora s-au gasit sa le aduca ei "imbunatatiri". De parca asa ceva e posibil, sau de parca is ei in pozitia de-a imbunatati perfectiunea. Ideea e si stupida si ridicola, si-n acest sens englejii au perfecta dreptate : nu e nevoie sa imbunatatim alfabetul latin. Faptul ca englejii-s singurii din Europa care au dreptate nu-i un motiv bun sau suficient pentru a face prostii.

      Teoria cu "se citeste asa cum se scrie", la care revine de fapt ce incerci tu sa rebranduiesti acolo drept o cu totul imaginara problema a "ambiguitatii" a fost amplu facuta de ris pe-aici, un punct de intrare ar fi intrebarile de-aici. In realitate, orice relationare intre foneme si morfeme va fi neaparat ambigua, dat fiind ca-i arbitrara. Discutia ceea nu-si are rostul, la fel de bine putem discuta despre cum ar fi bine sa mai adaugam niste numere intre 1 si 10 pentru ca exista totusi copii pentru care-i ambiguu 6, sa fie deci 6' pentru cazurile in care cele sase obiecte sunt mari si `6 pentru cazurile in care cele sase obiecte sunt sferice.

    11. prostosi`s avatar
      11
      prostosi 
      Thursday, 6 March 2014

      The a little above multivariate techniques are each and all pretty linear as with well a true model is calculated using linear combinations

    12. Mircea Popescu`s avatar
      12
      Mircea Popescu 
      Thursday, 6 March 2014

      I'm afraid that went over my head.

    1. [...] aproximativ douazeci de ore publicam niste statistica apropo de frecventa diversilor termeni in blogosfera de limba romana, chestie anuntata in ziua [...]

    2. [...] Belgradului din sus, citit cu accent pe a, Belgra'dului, cu d vocalizat ca gh (acelasi gh care inlocuie b din bine, ghine ?) si cu s romanesc notat ungureste, sz (asta asa, apropo de ß aka Eszett/scharfes S). [...]

    Add your cents! »
      If this is your first comment, it will wait to be approved. This usually takes a few hours. Subsequent comments are not delayed.