PageRank - Algoritmo di analisi

Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un collegamento ipertestuale d'un insieme di documenti, come ad esempio il World Wide Web, con lo scopo di quantificare la sua importanza relativa all'interno della serie. L'algoritmo può essere applicato a tutti gli insiemi di oggetti collegati da citazioni e riferimenti reciproci. Il peso numerico assegnato ad un dato elemento E è chiamato anche "il PageRank di E", siglato in PR (E).
L'algoritmo di PageRank è stato brevettato (brevetto US 6285999) dalla Stanford University; è inoltre un termine ormai entrato di fatto nel lessico dei fruitori dei servizi offerti dai motori di ricerca. Il nome PageRank è un marchio di Google.

  1. Elementi generali
    Letteralmente traducibile come rango di una pagina web (ma anche un gioco di parole collegato al nome di uno dei suoi inventori, Larry Page), il pagerank è facilmente riconducibile al concetto di popolarità tipico delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in relazione ai termini ricercati. Gli algoritmi che rendono possibile l'indicizzazione del materiale presente in rete utilizzano anche il grado di popolarità di una pagina web per definirne la posizione nei risultati di ricerca.
    Questo metodo può esser descritto come analogo ad una elezione nella quale ha diritto al voto chi può pubblicare una pagina web, e il voto viene espresso attraverso i collegamenti in essa presenti. I voti non hanno tutti lo stesso peso: le pagine web più popolari esprimeranno, coi propri link, voti di valore maggiore.

    L'interpretazione e la definizione della popolarità di un sito non sono però legate soltanto a queste votazioni, ma tengono conto anche della pertinenza del contenuto di una pagina, nonché delle pagine correlate, con i termini ed i criteri della ricerca effettuata. Altro importante elemento che lega un sito alla sua popolarità è relativo alla diffusione, alla popolarità dell'argomento trattato in esso. Per argomenti poco richiesti i siti raggiungono facilmente le prime posizioni nelle ricerche, ma altrettanto verosimilmente posseggono e mantengono un page rank che potrebbe essere bassissimo. Tutto questo permette, o perlomeno ha lo scopo, di attuare un controllo incrociato che garantisca la validità dei risultati di ricerca.
  2. Visualizzazione del grado di popolarità di un sito
    Per ottenere ad esempio informazioni riguardo alla notorietà di una pagina web in Google è possibile installare la Google Toolbar nel browser di navigazione oppure utilizzando servizi proposti da terze parti in grado di determinare tale informazione ed implementabili su siti internet.

  3. Formula semplificata
    L'algoritmo completo per il calcolo del PageRank fa ricorso all'uso della teoria dei processi di Markov ed è classificato nella categoria degli algoritmi di Link Analysis Ranking. Dalla formula inizialmente sviluppata dai fondatori di Google, Sergey Brin e Larry Page, è possibile comprendere come il PageRank viene distribuito tra le pagine:

    Dove:
    PR[A] è il valore di PageRank della pagina A che vogliamo calcolare.
    n è il numero di pagine che contengono almeno un link verso A.
    Pk rappresenta ognuna di tali pagine.
    PR[Pk] sono i valori di PageRank di ogni pagina Pk.
    C[Pk] sono il numero complessivo di link contenuti nella pagina che offre il link.
    d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all'altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.
    Dalla formula si nota quindi che all'aumentare del numero di link complessivi dei siti che puntano ad A il PageRank aumenta.

Ritieni il contenuto di questa pagina incompleto, non attendibile oppure oggetto di altre problematiche? INVIA UNA SEGNALAZIONE Grazie!

Tags cloud

ctr Satelliti vietati Francis Lawrence Vieste Romany Malco idrogeno giglio di Sant'Antonio Trasporto Aereo Baldissera Psicologo Leixen Lenny Kravitz Trichogaster leeri pittura corpo target carta lunare 3G fossili viventi Charles Hudson astronomia Tivùsat duplex terremoti Montreal avvio Ricky Gervais Cassiopea UEFA documentari C4FM FDMA Corrado Fortuna collina lago Francesco Paolantoni Pesce Leone volta celeste uranio 4/4 crateri marini Premium vanillina Protezione frequenze radioamatoriali laura revoca cancella granito Libero Bortolazzi SHF Hidetsugu Yagi stagioni Televisione configurazione ponti SimCity 4 pomodori MT63 Trevor Laird 5895 aristocratica telefono acceleratore Psichiatria Johann Bayer pressione VH1 Un Giorno Mi Dirai Egidio Veronesi genova offset FDMA Recco tdma gassosa alimentazione Giordano Bruno emilia Fox calcolare Erg FLV Issogne Comunicazione sifone Carburatore doppiaggio Natante PageRank Camperista CGIAR toolbar Store punti cardinali trasmissioni televisive Omega-3 amore medusa colonne Simón Bolívar Espansione Mare Imbrium Gradi Celsius ATV canzone xp incoming link sistema operativo FM Wake Up festival condensatore Etruschi Laura Morante illuminatore Continuous Wave Simulator pace-maker nutrice HOT BIRD Onde Stazionare Titius-Bode lievito 2015 90 conquistatore acquariofilia Grecale italia 2 Visa MasterCard Georg Simon Ohm carbonacee cina Onde Stazionarie polarizzazione QRM ottica luogo energia pulita Bora GTA sifonare pesce Liliaceae Cassino Mélanie Laurent Rifugio folgore atlante