Am lasat la sfirsit discutia acestui aspect extrem de controversat al algoritmului de ordonare a listelor generate de motoarele de cautare. Pentru a intelege conceptul care sta la baza stabilirii unui rang pentru o pagina web trebuie sa apelam mai intii la putina istorie.
Motorul de cautare Google a aparut in anul 1997 pe o piata pe care existau deja citeva motoare de cautare renumite, ca de ex. Altavista si Yahoo. Totusi, in decurs de citiva ani Google ajuns de la o cota de 0% la o cota de 70% din totalul cautarilor efectuate pe internet. Cauzele acestui succes rapid si covirsitor au fost in principal urmatoarele : 1) Extinderea numarului de pagini web indexate si 2) Folosirea unui algoritm foarte bun care pune de cele mai multe ori paginile web cele mai relevante pentru o anumita cautare in fruntea listelor generate de Google.
Motorul de cautare Google a fost primul care a indexat paginile aflate pe domeniul Geocities, care este cel mai mare furnizor de spatiu web gratuit pe internet. Poate parea ciudat insa chiar si in anii 2000-2001 motoarele de cautare Yahoo si Altavista nu indexau aceste pagini, lucru cu atit mai surprinzator pentru Yahoo cu cit domeniul Geocities se afla de fapt in posesiunea Yahoo. Desi pe acest domeniu sint in marea lor majoritate situri personale si nu situri profesioniste, cantitatea de informatie utila este apreciabila, iar optiunea Google de a indexa aceste pagini a facut sa creasca numarul de pagini relevante de pe listele generate de el ceea ce l-a avantajat in lupta cu competitoriii sai. Incepind cu anul 2002 dezvoltatorii celelorlalte motoare de cautare au invatat lectia si au inceput si ei sa trimita robotii tiritori pentru a indexa toate domeniile care furnizeaza spatiu web gratuit, incluzind aici si domeniile care contin pagini in alte limbi decit cea engleza (de ex. Home.ro). In privinta numarului de pagini indexate Google isi mentine pozitia de lider insa competitorii sai se afla la o distanta din ce in ce mai mica.
Algoritmul folosit de Google este un prilej permanent de speculatii pentru specialistii in optimizarea paginilor web. Acestia doresc sa-i exploateze la maximum caracteristicile, pentru a impune paginile web ale celor care ii angajeaza pe primele locuri in listele generate de Google. Unele din criteriile folosite de algoritm pentru a ordona listele in functie de relevanta paginilor au fost discutate mai sus. Despre alte criterii se stie doar de existenta lor, insa nu se stie importanta pe care o au in determinarea relevantei unei pagini. Acest lucru este cauzat de faptul ca programatorii care concep algoritmul il imbunatatesc permanent, munca lor fiind similara cu munca inginerilor care imbunatatesc draiverele placilor video pentru a le face sa functioneze mai eficient. Astfel, unele criterii care aveau initial o pondere mare in algoritm isi pierd cu timpul importanta pentru ca sint descoperite criterii mai bune sau pentru ca exista tendinta ca ele sa fie exploatate in mod necinstit de catre specialistii in optimizarea paginilor web.
Unul dintre criteriile care au adus succesul motorului Google si care in prezent isi pierde treptat din importanta este stabilirea unui rang pentru fiecare pagina web. Creatorii lui Google erau studenti in momentul in care au depus un patent pentru stabilirea de ranguri pentru paginile web, patent care a stat la baza functionarii motorului Google. In mediul educational (scoli, licee, universitati) ca si in societate in general un rol important in succesul social al unui individ este determinat de popularitatea sa, adica de simpatia pe care o au ceilalti fata de el. Un individ este popular pentru ca are niste calitati care il fac sa fie apreciat de cei din jur. Din aceasta cauza el este mereu inconjurat de prieteni.
Creatorii lui Google au extrapolat aceasta observatie si au aplicat-o la lumea paginilor web. Incercind sa creeze un algoritm mai bun decit cele existente, ei au pornit de la ipoteza ca o pagina web plina de continut si utila este mult mai populara decit alte pagini care trateaza acelasi subiect dar care sint mai sarace in continut. In mod similar cu un individ popular si pagina web populara este "inconjurata" de pagini "prietene" care au in ele legaturi catre ea. Cu alte cuvinte, cu cit o pagina a unui sit web are mai multe legaturi catre adresa ei in paginile altor situri, cu atit ea este mai populara si ca urmare putem presupune cu destula certitudine ca este o pagina utila, plina de continut informational.
Analizind numarul de legaturi care sint indreptate catre adresa unei pagini web putem sa incadram pagina respectiva intr-un anumit rang. Motorul de cautare Google incadreaza paginile in 10 ranguri, incepind cu rangul 0 (cel mai prost) pina la rangul 10 (cel mai bun). O pagina cu rang 0 nu are nici o legatura indreptata catre ea, in timp ce o pagina cu rang 10 are o multime de pagini web care o "recomanda" prin intermediul unor legaturi. Pentru ca o pagina sa fie incadrata intr-un rang mare nu este insa suficient sa aiba un numar mare de legaturi indreptate catre ea. Algoritmul ia in calcul si "calitatea" siturilor pe care se afla legaturile. O recomandare (legatura) venita de la un sit important (de ex. Yahoo sau ODP) are mult mai multa greutate decit una venita de la un sit cvasinecunoscut.
Acest criteriu de stabilire a relevantei paginilor web nu a fost niciodata secret si ca urmare specialistii in optimizarea paginilor web l-au utilizat in mod excesiv si uneori in mod necinstit pentru a promova paginile web ale celor care ii angajasera. Programatorii de la Google au devenit constienti de acest lucru si au luat masuri adecvate pentru a-l contracara, masuri care au constat in scaderea constanta a importantei criteriul popularitatii in determinarea relevantei unei pagini.
Aceasta decizie a celor de la Google a venit pe fundalul scaderii continue a preturilor pentru echipamentele hardware performante (de ex. servere) care a permis cresterea capacitatii de procesare si de stocare a informatiilor (culese din paginile we in baza de date. In consecinta, o data cu trecerea timpului este din ce in ce mai usor sa fie analizat mai temeinic continutul paginilor web, cel care trebuie sa fie in ultima instanta factorul decisiv in determinarea relevantei acestora. Rangul paginilor bazat pe "popularitatea" lor este folosit in continuare si este luat in consideratie atunci cind se ordoneaza lista de pagini generata de Google, insa impactul sau este mult scazut fata de anii de inceput ai lui Google.
Rangul unei pagini poate fi observat foarte usor daca instalam bara cu instrumente Google ("Toolbar" cu optiuni avansate. El este vizibil sub forma unei linii verzi care se alungeste progresiv pe masura ce pagina are un rang mai mare. Ducind cursorul mausului peste linie putem citi rangul unei pagini vizitate.
Datorita faptului ca este cel mai folosit motor de cautare, Google stirneste in permanenta discutii in rindul specialistilor (dar si al nespecialistilor) cu privire la modul de ordonare a siturilor web atunci cind este cautat un anumit cuvint (sau o anumita sintagma) si este generata o lista cu siturile continind cuvintul respectiv. Algoritmul folosit de Google este secret insa citeva aspecte ale acestuia sint explicate chiar pe situl Google in pagina PageRank Technology. De asemenea creatorii de situri web pot vizita pagina Webmaster Info tot de pe situl Google, pentru a afla citeva aspecte despre modul in care acest motor de cautare indexeaza paginile web.