Tutte le risposte

0350. Che cos'è il pagerank e come funziona?

espertomini

Cosa è esattamente il rank page di una pagina o di un sito web ? E' una classifica ? Ma come funziona ? (Stefania Pottrini) (2232_3210_5622)

 

sem_esperto_verdeLa web-nauta Stefania si riferisce evidentemente al PageRank, un algoritmo utilizzato per valutare i contenuti presenti sulle pagine Internet utlizzato da Google, il più diffuso motore di ricerca sulla rete. Cercare nei motori di ricerca ha sempre significato ottenere come risultato migliaia di documenti, ordinati secondo la rilevanza dei termini della nostra query, misurata su moltissimi parametri legati alla presenza e alla posizione dei termini nella pagina. La maggior parte delle tecnologie utilizzate dai motori di ricerca, che oggi conosciamo e usiamo frequentemente, fanno riferimento invece anche ai link da e verso una pagina web (Inbound e Outbound link), per valutare l'importanza e determinare il posizionamento della pagina nei confronti di una data keyword. Sapere come i motori di ricerca considerano i link fra le pagine Internet è quindi importante per conoscerli e comprendere sempre meglio i motivi che muovono le pagine all'interno dei loro database. In origine, alla base, di tutto c'è stato il problema/obiettivo di riuscire ad usare un parametro "umano" per determinare quanto fosse rilevante una pagina sulle altre, rispetto a un certo termine. Ma come fare questo senza dover coinvolgere (e quindi pagare) un gran numero di persone e studiare un sistema valido per consentire loro di dare valutazioni "oggettive"? L'unico modo era creare un sistema matematico incentrato sulla valutazione, spesso non espressamente riconosciuta, di un sito da parte di altri responsabili, amministratori e creatori di website. In pratica il sistema doveva poter rispondere alla domanda "Cosa pensano gli altri del mio sito? Quanto lo valutano pertinente e interessante rispetto ad un dato argomento?". Google sembra essere stato un pioniere nell'utilizzo dei collegamenti ipertestuali per la creazione di un sistema di valuazione dell'importanza di un website. Grazie alla tecnologia chiamata PageRank, Google riesce oggi a fornire risultati altamente pertinenti stabilendo in modo del tutto automatizzato una misurazione oggettiva dell'importanza di ogni singola pagina web presente nel suo database. PageRank utilizza un'equazione di circa 500 milioni di variabili e 2 miliardi di termini per creare una struttura dei link della Rete che poi utilizza come strumento di organizzazione e valutazione. Questo sistema non esegue semplicemente un conteggio dei link al nostro sito presenti nelle pagine da lui indicizzate (cioè la Link Popularity) e un conteggio dei link dal nostro sito verso queste stesse pagine, ma valuta anche la provenienza e quindi la "qualità" dei link, o meglio la pertinenza rispetto all'argomento trattato nella nostra pagina. Se si vuole avere idea PageRank di un sito o di una specifica pagina si può scaricare la Google Toolbar ed è anche utile interrogare altri motori per sapere quanti link alle pagine considerate sono presenti nei vari database. Come abbiamo detto la rilevanza di un sito rispetto ad un determinato argomento non si ricava semplicemente dal numero dei link a tale sito presenti sulla rete. Pensiamo infatti a Yahoo!: sicuramente ha un enorme numero di link in tutto il Web e tanti probabilmente anche da siti di carattere scentifico, ma non si può dire che sia anche il sito più autorevole e pertinente rispetto all’argomento "fisica quantistica". Il PageRank di Google vuole invece valutare proprio questa rilevanza. Cerchiamo di comprendere meglio questo strumento: Google interpreta un link dalla pagina A alla pagina B come un voto di A per B e se a sua volta anche B ha un link verso A entrambe ricevono un voto ancora più alto (Feedback-Link). Se la pagina B ha un PageRank più alto il valore di un suo link è ancora più elevato, ma se ha un valore più basso non esiste nessuna penalità. L'importanza di una pagina è data dal voto che questa riceve "dalla Rete" nella sua globalità e i link interni al nostro sito determinano il PageRank delle pagine interne. Se infatti i link che otteniamo dall'esterno sono diretti all'Home Page questa avrà una valore più elevato e le pagine del nostro sito direttamente collegate ad essa (ad esempio quelle relative alle sezioni principali) avranno un valore di PageRank immediatamente minore, ma più elevato di quelle non linkate. Per i progettatori di siti web è quindi fondamentale valutare criticamente la struttura gerarchica delle pagine in fase di restyling del sito oppure di creazione del sito ex-novo, in modo da prevedere sistemi utili a suggerire collegamenti fra le pagine soprattutto in base alla pertinenza di una con l'altra. Con l'obiettivo di aumentare il PageRank delle pagine più importanti potremmo inserire, ad esempio, link diretti dall'Home Page ad alcune pagine con articoli o servizi che si trovano nel 4° o 5° livello. Il fattore principale nella determinazione del PageRank sono i link provenienti dall'esterno, quelli più difficili da ottenere e mantenere se il nostro sito non presenta contenuti validi e facilmente accessibili. Non solo: è fondamentale che i link siano testuali e che il testo ad essi associato contenga parole-chiave in tema alla pagina alla quale puntano. Su questi fattori sono concordi i principali esponenti delle tecnologie di ricerca oggi presenti sul Web, non solo Google, ma anche Ask Jeeves/Teoma e FAST. Tutti consigliano di tessere una rete di relazioni con altri siti del settore, evitando di associarsi a siti mal strutturati e che a loro volta hanno un numero troppo esiguo di link dall'esterno. Ricordiamo, comunque, che i parametri che partecipano al ranking delle pagine, su Google come su altri motori, sono influenzati solo in parte dai link, mentre non ci stancheremo mai di ripetere quanto anche il semplice titolo delle nostre pagine sia fondamentale.

Raffaele Galano – Responsabile MotoriDiRicerca.IT

Nota Redazionale SXT

La risposta del Dr. Galano è un riadattamento di un articolo già apparso sul sito www.MotoriDiRicerca.it icona_linkesterno da lui coordinato)


 

 
Tags:
Utilizza il filtro dei tags anche digitando le lettere della parola che stai cercando

© 2002 - 2018 ScienzaPerTutti - Grafica Francesca Cuicchio Ufficio Comunicazione INFN - powered by mspweb

NOTA! Questo sito utilizza i cookie e tecnologie simili.

Se non si modificano le impostazioni del browser, l'utente accetta. Per saperne di piu'

Approvo

Informativa sulla Privacy e Cookie Policy

Ultima modifica: 28 maggio 2018

IL TITOLARE

L’INFN si articola sul territorio italiano in 20 Sezioni, che hanno sede in dipartimenti universitari e realizzano il collegamento diretto tra l'Istituto e le Università, 4 Laboratori Nazionali, con sede a Catania, Frascati, Legnaro e Gran Sasso, che ospitano grandi apparecchiature e infrastrutture messe a disposizione della comunità scientifica nazionale e internazionale e 3 Centri Nazionali dedicati, rispettivamente, alla ricerca di tecnologie digitali innovative (CNAF), all’alta formazione internazionale (GSSI) ed agli studi nel campo della fisica teorica (GGI). Il personale dell'Infn conta circa 1800 dipendenti propri e quasi 2000 dipendenti universitari coinvolti nelle attività dell'Istituto e 1300 giovani tra laureandi, borsisti e dottorandi.

L’INFN con sede legale in Frascati, Roma, via E. Fermi n. 40, Roma, email: presidenza@presid.infn.it, PEC: amm.ne.centrale@pec.infn.it in qualità di titolare tratterà i dati personali eventualmente conferiti da coloro che interagiscono con i servizi web INFN

IL RESPONSABILE DELLA PROTEZIONE DEI DATI PERSONALI NELL’INFN

Ai sensi degli artt. 37 e ss. del Regolamento UE 2016/679 relativo alla protezione delle persone fisiche con riguardo al trattamento dei dati, l’INFN con deliberazione del Consiglio Direttivo n. 14734 del 27 aprile 2018 ha designato il Responsabile per la Protezione dei Dati (RPD o DPO).

Il DPO è contattabile presso il seguente indirizzo e.mail: dpo@infn.it

Riferimenti del Garante per la protezione dei dati personali: www.garanteprivacy.it

Il TRATTAMENTO DEI DATI VIA WEB

L'informativa è resa solo per i siti dell'INFN e non anche per altri siti web eventualmente raggiunti dall'utente tramite link.

Alcune pagine possono richiedere dati personali: si informa che il loro mancato conferimento può comportare l’impossibilità di raggiungere le finalità cui il trattamento è connesso

Ai sensi dell'art. 13 del Regolamento UE 2016/679, si informano coloro che interagiscono con i servizi web dell'Istituto Nazionale di Fisica Nucleare, accessibili per via telematica sul dominio infn.it, che il trattamento dei dati personali effettuato dall'INFN tramite web attiene esclusivamente ai dati personali acquisiti dall'Istituto in relazione al raggiungimento dei propri fini istituzionali o comunque connessi all’esercizio dei compiti di interesse pubblico e all’esercizio di pubblici poteri cui è chiamato, incluse le finalità ricerca scientifica ed analisi per scopi statistici.

In conformità a quanto stabilito nelle Norme per il trattamento dei dati personali dell’INFN e nel Disciplinare per l’uso delle risorse informatiche nell’INFN, i dati personali sono trattati in modo lecito, corretto, pertinente, limitato a quanto necessario al raggiungimento delle finalità del trattamento, per il solo tempo necessario a conseguire gli scopi per cui sono stati raccolti e comunque in conformità ai principi indicati nell’art. 5 del Regolamento UE 2016/679.

Specifiche misure di sicurezza sono osservate per prevenire la perdita dei dati, usi illeciti o non corretti ed accessi non autorizzati.

L’INFN tratta dati di navigazione perché i sistemi informatici e le procedure software preposte al funzionamento di questo sito web acquisiscono, nel corso del loro normale esercizio, alcuni dati la cui trasmissione è prevista dai protocolli di comunicazione impiegati. Questi dati - che per loro natura potrebbero consentire l'identificazione degli utenti - vengono utilizzati al solo fine di ricavare informazioni statistiche anonime sull'uso del sito e per controllarne il corretto funzionamento. Gli stessi potrebbero essere utilizzati per l'accertamento di responsabilità in caso di compimento di reati informatici o di atti di danneggiamento del sito; salva questa eventualità, non sono conservati oltre il tempo necessario all'esecuzione delle verifiche volte a garantire la sicurezza del sistema.

UTILIZZO DI COOKIE

Questo sito utilizza esclusivamente cookie “tecnici” (o di sessione) e non utilizza nessun sistema per il tracciamento degli utenti.

L'uso di cookie di sessione è strettamente limitato alla trasmissione di identificativi di sessione (costituiti da numeri casuali generati dal server) necessari per consentire l'esplorazione sicura ed efficiente del sito. Il loro uso evita il ricorso ad altre tecniche potenzialmente pregiudizievoli per la riservatezza della navigazione e non prevede l'acquisizione di dati personali dell'utente.

DIRITTI DEGLI INTERESSATI

Gli interessati hanno il diritto di chiedere al titolare del trattamento l'accesso ai dati personali e la rettifica o la cancellazione degli stessi o la limitazione del trattamento che li riguarda o di opporsi al trattamento secondo quanto previsto dagli art. 15 e ss. del Regolamento UE 2016/679. L'apposita istanza è presentata contattando il Responsabile della protezione dei dati presso l’indirizzo email: dpo@infn.it.

Agli interessati, ricorrendone i presupposti, è riconosciuto altresì il diritto di proporre reclamo al Garante quale autorità di controllo.

Il presente documento, pubblicato all'indirizzo: http://www.infn.it/privacy costituisce la privacy policy di questo sito, che sarà soggetta ad aggiornamenti.