Googlenelamurie nocturna
Monday, 06 February, Year 4 d.Tr. | Author: Mircea Popescu
Tocmai ce mi s-a atras atentia pe o chestie, sa v-o explic pe scurt :
Pe larg, Google indexeaza (in vreo cinci minute sau ceva de genu', inca din 2010) corect Trilema, 99.x% din pagini apar acolo, am ceva peste cinci mii de articole, e in regula. Google indexeaza de asemenea corect fain, chiar daca in webmasters/tools/ zice ca nu are in index decit ~ jumatate din paginile din sitemap totusi dincoace zice corect. Dtng nu are rezultate indexate, cum puteti sa va convingeti de altfel si singuri. Alte surse de continut nu am, ar fi pagina de BTC da' totusi, e fix o pagina.
Si-atunci 75`000 + 5`000 nu da neam nicicum 299`000. Umfla Google numerele ? Am pe undeva ceva problema ?
Ascultam expertii.
Category: AICMF
Monday, 6 February 2012
Pai results astea n-au legatura directa cu cautarile in sine? adica poate 3 persoane au cautat 3 lucruri diferite mai precis cu 3 cuvinte cheie diferite si au ajuns totusi la acelasi articol al tau .... zic si eu
Monday, 6 February 2012
A, nu, nu, astea n-au nici o treaba cu cautarile, sunt teoretic numarul de pagini disponibile.
Monday, 6 February 2012
http://polimedia.us/fain/groups/romanian-bloggers/members
Monday, 6 February 2012
Pai simplu. Mie-mi arata 7000 si n-am 7000 de postari. Dar daca adun si pozele? Fiecare poza e http://site.com/files/data/poza.jpg , deci, in capul meu, este o pagina in sine. Apare si ea in cautari Google Imagini. So, cate imagini ai? Adunat si cu dtng, probabil ala-i nr. Problema rezolvata?
Monday, 6 February 2012
@Flaviu-Luchian "invalid username or userid in get_avatar", adica zici ca-i problem ? Da' n-ar trebui atunci sa se vada la ultima chestie, sa fie 295`000 in loc de 75`000 ?
@Ionut Mei problema e asa : tu ai un mar si-o para. Cineva vine si ti le cintareste si zice ca maru' are 50 de grame si para 750 de grame. Dupa care le cintareste impreuna si au trei kile. Pai ?!
Pe dtng sunt sa zic vreo 15`000 de imagini, pe Trilema (chiar admitind ca nu intra la site:trilema.com) sa tot fie vreo trei mii. Tot n-ajungem.
Monday, 6 February 2012
Am incercat si io, de curiozitate.
site:polimedia.us
Aproximativ 371.000 (de) rezultate (0,05 secunde)
site:trilema.com
Aproximativ 5.850 (de) rezultate (0,15 secunde)
site:polimedia.us/dtng
Aproximativ 115 (de) rezultate (0,08 secunde)
/* asta dupa ce am cerut sa-mi afiseze rezultatele similare, altfel era 1 rezultat */
site:polimedia.us/fain
Aproximativ 69.400 (de) rezultate (0,16 secunde)
site:polimedia.us -site:trilema.com -site:polimedia.us/fain
Aproximativ 3.000 (de) rezultate (0,18 secunde)
site:polimedia.us -site:trilema.com -site:polimedia.us/fain -polimedia.us/dtng
8 rezultate (0,12 secunde)
Deci .. cum ?!
Monday, 6 February 2012
Nu am nici cea mai vaga idee.
Cre' ca Google scoate numerele din burta ? Da' in mod ciudat numa' unele ?
Monday, 6 February 2012
Google se mai uita si la fatza omului.
Monday, 6 February 2012
Gasesti "About 15,400 results" daca te uiti "doar in ultimul an" pe polimedia.us.
Google nu uita. numarul de +370K e probabil legat de ceva porcarii (sau sa le zicem teste) facute te tine pe vremuri.
Monday, 6 February 2012
Haha gheorghe +1
Monday, 6 February 2012
deci pagini ce nu mai exista?
Monday, 6 February 2012
gheorghe +1 :))
Monday, 6 February 2012
Pagini de pe fostul forum rămase indexate în Google?
Cred că eu am obţinut cel mai mare nr de rezultate pt Trilema, 6070. Asta pe setările mele de căutare, dacă activez safe search la maxim obţin mai puţine. Probabil unele articole sunt catalogate drept porn.
Monday, 6 February 2012
@gheorghe Lolz.
@Dr;A Pai oarecum logic, Trilema are 4 ani, fainul 2-3. E si oarecum ilogic, dat fiind ca-n ultimul an au aparut cam 25k pagini pe cele doua.
Concret despre ce porcarii vorbesti, dat fiind ca eu n-am facut (indiferent cum le-am zice) ?
@Ionut Nu-i clar de ce le-ar numara daca nu exista.
@Lotus Da exemplu de una ?
Nu cred ca are legatura pornul, de exemplu site:sex.com da 6k rezultate. Ma gindesc ca or fi majoritatea porn.
Tuesday, 7 February 2012
cautasem un mod de a afisa o histograma cu data paginilor din index. Am dat peste un patent al google pentru asta dar n-am dat de scula implementata. Chestie care face verificarea ipotezelor dificila. Ar trebui sa vezi cand au aparut alea 300k pagini in plus ca sa poti identifica sursa. Sau sa iei la rand toate directoarele de sub polimedia.ro si sa le testezi in index.
Revenind la porcarii am vreo 2-3 piste in memorie dar fara posibilitatea de a le verifica le las acolo.
tu cu siguranta ai mai avut si alte proiecte in trecut (pe care nu le-ai verificat ?).
Tuesday, 7 February 2012
@Mircea Popescu Nu ştiu, întrebam.
Tuesday, 7 February 2012
@Dr.A Mei, pofteste de numeste pistele, ce esti atita de sfios ? Doara-i Internet.
polimedia.us a fost inregistrat pe 2 Octombrie 2007, deci nu-i vorba de cine stie ce "trecut" asa, vag si misterios, 1965 gen. Directoarele din index cit si tot misterul asta sugestivo-presupozitiv nu prea isi are locul, dat fiind ca noi vorbim de ~225`00 de pagini pe care aparent nu le gaseste nimeni. Fain-ul il gaseste toata lumea, Trilema o stie toata lumea, astea impreuna ar fi ceva de genul 25% din megaobiectul in discutie. Cum e posibil sa stea ascunse trei sferturi dintr-o chestie a carei sfert vizibil e chiar atit de vizibil ?
Chiar si admitind ipoteza ca "ele nu mai exista dar au existat" (care-i intimplator falsa, da' sa zicem ca discutia aia-i irelevanta pentru ce discutam noi de fapt) tot nu are sens sa fie prezentate drept pagini care exista. Dat fiind ca nu exista. Sau ?
In tot cazul, chestiile sterse de-a lungul timpului sunt :
/trip, care-a fost vindut in 2010 da' nu era mult diferit de actualul /bitcoin, in sensul ca afisa o singura pagina ;
un forum php/Olympus (chit ca ar fi trebuit teoretic sa fie vazut de pe domeniul propriu, da' sa zicem ca din motive obscure s-a retinut cumva la polimedia.us), inchis cindva prin 2010 (despre care am scris in Septembrie anul trecut) si care avea la punctul maxim poate hmm, poate zece pina a douazeci de mii de pagini chit ca nu pricep de ce-ar fi fost indexate,
Pe linga astea mai exista
/codebase, unde se gasesc citeva (adica unitati, nu zeci) de fisiere cu exemple de cod, unele link-ate chiar de pe Trilema
/books, unde se gasesc ceva gen 38 de pagini cu text
/ads unde se gasesc uneori bannere cind am campanii active da' in general e gol (fusese initial folosit pentru incercarea de pre-fain descrisa aici.
Nici una dintre astea nu-i o explicatie pentru 300k pagini, pe bune acuma.
Tuesday, 7 February 2012
- jocul ala epothy unde era gazduit ? parca ziceai ca avai ceva atac spam pe forum
- vazusem pe ceva site frelance o cerere de a ta de a creea sub domenii cu site-uri ?
- o schimbare de structura ...
- ai mai avut tu ceva proiecte (tweeter counter)
- e posibil sa apara inregistrate dintr-o eroare si search q. cu date de la bac
Tuesday, 7 February 2012
Ala e forumul de care discutam dinsus.
O cerere de hm ? In disputa cu Catalin Tenita despre cum si de ce nu functioneaza asa zisa lor metoda de "indexare" a blogurilor romanesti i-am facut un fisier rss care genera continut aleatoriu automat, ca sa-i arat ca poti lua ce scor doresti. Despre aia vorbim ?
O schimbare de structura adica ce ?
Tweeter counter = trip, de care ziceam dinsus.
Datele de la bac sunt cincizeci de pagini, toate indexate de altfel. Zici ca le numara de mai multe ori sau ceva ?
Tuesday, 7 February 2012
nu. despre altceva.
Tuesday, 7 February 2012
...
Tuesday, 7 February 2012
http://www.freelancer.sg/job-search/polimedia/
Tuesday, 7 February 2012
Din ce vad eu acolo e chestia discutata apropo de "romanii si munca". N-are nici o treaba cu "creat pagini", era de muncit la fain.
Tuesday, 7 February 2012
la proiect 4 da la primele 3 ?
Tuesday, 7 February 2012
Alea par ceva de facut bloguri pe wordpress, nu-mi mai amintesc exact ce drac si pentru cine anume da' pare destul de clar ca singura legatura cu domeniul polimedia.us este ca pe-o pagina acolo se gasea lista cu cuvinte cheie sau ceva.
De fapt ba da, imi amintesc perfect. Dupa ce le-am demonstrat zisilor Treeworks ca metoda lor nu functioneaza pur si simplu au blocat achizitia de rss de pe trilema. Asa ca le-am mai demonstrat o tura ca metoda lor tot nu functioneaza, de data asta via wordpress.com. Nu ca le-ar fi servit la ceva, da' in epoca inca verificam teoria naiva ca avem de-a face cu oameni pe picioarele lor, nu cu slugoi tipici locului. Istorie.
Tuesday, 7 February 2012
Tu parca te lasasei de twitter, deci ce cauti pe twitter?
Tuesday, 7 February 2012
Adica ?
Tuesday, 7 February 2012
http://twitter.com/#!/Mircea_Popescu
5 hours ago etc
Tuesday, 7 February 2012
Twitterfeed e un serviciu care ia articolele prin rss si le publica pe twitter.
Tuesday, 7 February 2012
site:polimedia.us
Environ 372 000 résultats
site:polimedia.us -trilema
Environ 322 000 résultats
site:polimedia.us -trilema -fain
Environ 578 résultats
site:polimedia.us -fain
Environ 4 090 résultats
Numarul de 320k e aparent de pe fain unde indexeaza dupa taguri useri voturi zile etc.
Tuesday, 7 February 2012
Si-atunci cum se explica al treilea exemplu din imagine ?
Tuesday, 7 February 2012
site:polimedia.us -trilema
Environ 63 000 résultats
pe google.fr
cum ziceam verifica tu site:polimedia.us -trilema si o sa vezi ca pe fain ai o gramada de pagini (in com)
Ce-i sigur e ca grosul paginilor indexate nu-s din ultimul an. si ca vin de pe fain nu de pe trilema.
Tuesday, 7 February 2012
site:polimedia.us -trilema : About 322,000 results.
Nu prea inteleg ce relevanta are s-o dam in limbi, adica google.fr nu raporteaza aceiasi indecsi, bun, da' de ce conteaza asta ?
Faza cu site:polimedia.us -fain : About 4,090 results (respectiv site:polimedia.us fain : About 293,000 results) e dubioasa, si ce inca si mai dubios este ca acum site:polimedia.us/fain raporteaza... About 365,000 results.
Deci de pe 6 cind arata 75k (si 299k total) pina azi cind arata 365k (About 372,000 results in total) s-a schimbat exact ce ?
Eu am impresia ca Google pur si simplu scoate numerele alea din burta.
Saturday, 18 February 2012
Re comm#9: MP != MW.
Saturday, 18 February 2012
Lolz. Ahh, 2005, pe cind tineretul descoperea Internetul...