|
I motori di ricerca sono dei programmi automatici che raccolgono, ricercano e classificano pagine web basandosi su formule matematiche che ne stabiliscono la pertinenza e la rilevanza in base a determinate chiavi di ricerca.
Quando l’utente interroga il motore di ricerca ricercando una determinata combinazione di parole (ovvero “fa una query”), questo passa in rassegna i dati che ha raccolto e restituisce all’utente una classifica delle risorse più pertinenti per tale ricerca. Il procedimento seguito per stabilire la rilevanza delle pagine web si basa su algoritmi matematici e database il cui funzionamento non viene solitamente rivelato.
Per ricercare e catalogare tutte queste risorse online, i motori di ricerca utilizzano dei programmi appositi chiamati spider (o robots o crawler) che visitano le url presenti sul web e scansionano le pagine raccogliendo informazioni presenti nel codice sorgente della pagina (metatags, contenuto, link, data di pubblicazione). Le pagine web che corrispondano ai criteri stabiliti dal motore di ricerca, dopo essere state analizzate, entrano a far parte del suo database; quando una pagina entra nel catalogo di un motore di ricerca si dice che è stata “indicizzata”, ovvero inserita nel suo indice: le pagine indicizzate vengono utilizzate dai motori di ricerca per fornire risposte alle richieste degli utenti. Un utente fa una query inserendo una o più keywords (parole chiave) nella stringa di ricerca del motore, questo (in base ai criteri di rilevanza che ha stabilito) fornisce una classifica delle pagine web più pertinenti a questa ricerca, la cosiddetta SERP (Search Engine Result Page). In base a quali criteri i motori di ricerca stabiliscono quali pagine sono più pertinenti per una query? Come abbiamo detto gli algoritmi di calcolo che utilizzano sono segreti ma comunque sappiamo che la maggior parte dei motori prende in considerazione elementi come la presenza nella pagina di determinate combinazioni di parole chiave, i metatags della pagina, i link in uscita e in entrata e altri fattori.
|


















