Noi cu drag teseam

Tuesday, 14 December, Year 2 d.Tr. | Author: Mircea Popescu

Daca aveti macar trei ani vechime pe internet nu exista sa nu fi primit un spam de-ala cu $name$ prin el. V-ati intrebat vre-odata care-i cauza ?

Pai, simplu : textul se scrie ca un model, dupa care un script inlocuieste anumite elemente unice in anumite locuri. Deci daca in baza de date email-ul dvs. figura sub numele Georgel Apreotesii, apai script-ul inlocuia $name$ cu Georgel Apreotesii. Dar in cazul respectiv scriptul n-a functionat din ceva motiv (ca de exemplu pentru ca spamerul fiind cam idiot nu l-a setat corect) si iata, draga $name$, avem o $offer$ for you. Scrieti-ne la $email$ pina la $termenul_limita$ si intrati in posesia $premiului$. Pai nu ? :D

Ei, dar iata ca am primit un exemplu si mai incornorat, acum nici cinci minute :

spun-content

Deci cee ? Cum vine

Your {blog|site} is {realy|very|fun} and {interesting|cool|nice|good} .{Its not like|it is not like|Its not similar to} all {those|these} auto-blogs {popular|that are many around} now. Its a {live|real} one. Its {cool|nice|great|good}!…

Pai vine foarte bine. Un script ar fi trebuit sa citeasca acoladele, si sa aleaga un singur cuvint, la intimplare. Textul rezultat ar fi putut fi

Your blog is very and good .Its not similar to all these auto-blogs that are many around now. Its a real one. Its great!

la fel de bine cum ar fi putut fi si

Your site is fun and nice .Its not like all those auto-blogs popular now. Its a real one. Its cool!

Care-i scopul ? Pai, in principiu si teoretic, cel putin la nivelul tehnologic al anilor 2005, motoarele de cautare neposedind capacitati de analiza semantica prea aprofundata considera cele doua exemple drept text diferit. Si iata cum poti evita "duplicate content", pastrind totusi aceeasi structura gramaticala si suprastructura intensionala a textului. Acelasi principiu ca si in primul caz discutat, cind se "personalizeaza" un text after the fact, dar aplicat ceva mai larg. Zvonurile spun ca asa se scriu scripturile pentru angajatii la tech support, da' nu vom sti adevarul ala niciodata.

Cum vi se pare chestia ?

Category: Meta psihoza
Comments feed : RSS 2.0. Leave your own comment below, or send a trackback.

22 Responses

  1. pai eu zic sa ascultam zvonurile si sa o dam pe conspiratie.

    acuma, sincer... cum sa ni/mi se para? eu nu fac bani din asta, deci nu ma atinge. si ii un askimet ii cam rezolva pe baieti cu toate incercarile lor de fentare. pana la urma filtrul ala bayesian(pe trilema am aflat de el) nu e un lucru chiar atat de rau. :D

  2. ii=2=doi

  3. Mircea Popescu`s avatar
    3
    Mircea Popescu 
    Tuesday, 14 December 2010

    Pai nu e un lucru rau, afara de cazul ca iti pasa daca ajung nevinovati in gherla. Mie imi pasa, de exemplu, poate singurul din .ro.

  4. cat am avut blog pe .com nu am folosit deloc filtru bayesian, ci toata moderarea am executat-o manual. si crede-ma, e departe de conspiratie akismet. acuma, nu zic ca nu ar putea ei bloca pe cineva intentionat, dar exista doar 3 moduri sa faca asta: fie pe continut, fie pe mail, fie pe ip. si orice baiat destept poate evita blocajele astea. daca nu poate, cred ca merita sa ajunga in gherla. :D

  5. romania inedit`s avatar
    5
    romania inedit 
    Tuesday, 14 December 2010

    Eu primii o oferta cu trei milioane si jumatate de adresede e-mail cu numai 500 de lei plus program ajutator de completat e-mailuri si primesc spam asemanator ca al tau pe blog , dar pana acuma nu am primit spamuri ca astea de dedesi exemplu .

  6. Mircea Popescu`s avatar
    6
    Mircea Popescu 
    Tuesday, 14 December 2010

    @Mihai Problema cu Akismet nu vine din partea de filtru bayesian, ci din partea de utilizare distribuita. In general, de cite ori folosesti un sistem distribuit te bazezi pe "buna credinta" (nu neaparat in sens legal, si prostia tot rea credinta este, in aceasta perspectiva teoretica) a celorlalti utilizatori.

    Intr-un mediu foarte vast si foarte divers, chestia merge cit de cit. In .ro nu merge deloc, si-ti explic cu un exemplu simplu : daca un bloger oarecare se cearta cu un alt bloger oarecare, oricare dintre cei doi isi poate ruga prietenii sa-l adauge pe celalalt in spam, impreuna eventual cu orice sustinatori. Rezultatul net fiind o groaza de blogeri "mici" care nu mai ies de-acolo.

    Eu nu-s dispus sa nu pot citi comentarii trimise mie de nimeni pentru ca o facut respectivul gresala sa-l injure nu stiu pe cine. Insusi faptul ca se stie sau se crede ca-i periculos (din aceasta cauza) sa te certi cu nu stiu ce "bloger mare" e deja un chilling effect semnificativ si intolerabil.

    De-aia sunt eu impotriva Akismet : a-l folosi inseamna, practic, a credita "comunitatea" blogerilor romani, ori eu n-o creditez nici macar cu epsilon. Singurul motiv pentru care blogerii romani se asociaza este ca sa se certe, fie intre ei fie cu altii. Recent a aparut si varianta in care se asociaza ca sa fure, vezi trupele Oprea - Cocioaba - Manafu, dar inca o asociere in scopuri respectabile n-am vazut. Nu vorbim aici bineinteles despre ce declara diversi, ca n-or fi prosti sa recunoasca, si daca-i pina acolo nici nu cred ca au discernamintul sa isi dea seama.

    @romania inedit Si eu primesc de-alea, saptaminal. Iote, azi

    Mansfield M Terrance Mon, 6:03 pm [rft 70] : business email lists for sale

    Viata grea.

  7. romania inedit`s avatar
    7
    romania inedit 
    Tuesday, 14 December 2010

    Pot sa confirm treaba cu akismet .
    Si pe mine m-au bagat niste nimeni la spam dupa ce mi-am bagat niste opinii pertinente .

  8. dk tu abia acum / in acest moment ai primit / ti s-a scris un astfel de comment / comentariu / feedback sunt dezamagit / neplacut surprins / festelit la madular fiindca / pentruca eu eram convins ca un blog cu traficul trilemei s-a-ntalnit tare demult / cu mult timp in urma cu asa ceva / astfel de cacareli. eu de pilda cu blogul / experimentul / jurnalul meu online cu numai cativa pe zi din care majoritatea sunt copiii mei pe care inca nu i-am intalnit am primit asa ceva cam cu un an in urma.

  9. Mircea Popescu`s avatar
    9
    Mircea Popescu 
    Tuesday, 14 December 2010

    1. Congrats to the winners.
    2. ???
    3. Profit!

  10. ooh, we have a winner

  11. Anonimosu`s avatar
    11
    Anonimosu 
    Tuesday, 14 December 2010

    @MP Asta e prima oara cand primesti asa ceva?

  12. Mircea Popescu`s avatar
    12
    Mircea Popescu 
    Tuesday, 14 December 2010

    Nu.

  13. sigur nu se scriu asa

  14. Mircea Popescu`s avatar
    14
    Mircea Popescu 
    Wednesday, 15 December 2010

    Ce zici tu acolo ? Ca nu se prea intelege.

  15. zic scripturile pt angajatii techsupport

  16. Mircea Popescu`s avatar
    16
    Mircea Popescu 
    Wednesday, 15 December 2010

    Aa... Si de ce esti chiar atit de sigur ?

  17. Mie mi se pare așa (pură speculație): spammer-ul în cauză folosește ceva soft (probabil un script luat de pe Interneți) de parsat expresii regulate la care și-a făcut update. Problema e că update-ul e posibil să fi introdus și niscaiva schimbări în sintaxă, motiv pentru care nu-i mai parsează bălăriile.

    Sau a dat disable la parser în ce sistem software folosește el acolo, dar chestia oricum trimite spam automat, așa că i-a trimis textul brut, din baza de date.

  18. Mircea Popescu`s avatar
    18
    Mircea Popescu 
    Saturday, 18 December 2010

    Sau a deschis un nou server de spam, pe un sistem mai ieftin (deh, e criza) care n-are facilitati de spinning si el nu a citit specificatiile si nu stie.

  1. [...] Mare abundenta de clisee stupide ("din generatie in generatie" - asta ar trebui deja interzis ; "noi orbii simtim mai multe"), adesea lipite pur si simplu deolalta cu muci, si toata eleganta unui spammer. [...]

  2. [...] in sus, spre mai bine) al (societatii, statului, partidului) (noastre, voastre, lor). Fina tesatura de matase, ce sa mai. Si voi care credeati ca Netbridge a inventat seo spam-ul. Ținînd seama de [...]

  3. [...] kilometri de text si i-a taiat impreuna, mai amestecind bucatele. Deci nu-i vorba de obisnuitul spun content, ci e text indexat cu maxima pricepere. Maxima [...]

  4. [...] sa mi se traduca, unde si ce e bataia de joc, care-i sensul folosirii expresiei, ce facem aici, tesatorie [...]

Add your cents! »
    If this is your first comment, it will wait to be approved. This usually takes a few hours. Subsequent comments are not delayed.