Articoli

Phantom: Google e l’algoritmo misterioso

PhantomUn fantasma si aggira nei meandri del sistema di ranking di Google. È per ora poco conosciuto, ma ha già terrorizzato molti siti che si sono ritrovati ad avere un crollo di referral dal noto motore di ricerca. Nessuno sa come funzioni né come si chiami esattamente ma Glenn Glabe della G-Squared interactive, che lo sta studiando a fondo, l’ha chiamato Phantom…l’algoritmo fantasma!

Chi si occupa di Internet sa che gli algoritmi di un motore di ricerca sono quei “software” (mi perdonino gli esperti informatici per questa licenza poetica) che servono a determinare il ranking di un sito, cioè il suo posizionamento all’interno dei risultati di ricerca. Gli esperti di SEO sanno che, se si parla di Google, gli algoritmi più importanti sono Hummingbird, Panda e Penguin, oltre al noto PageRank che per tanto tempo è stato il Re del motore di ricerca di Mountain View. Nel 2013 però furono in molti ad accorgersi che ci fu un piccolo “scossone” nella reputazione dei siti indicizzati da Google che non era riferibile a nessuno degli algoritmi conosciuti ma era qualcosa di diverso anche se in qualche modo legato alle caratteristiche del Pinguino e del Panda. Data la sua natura misteriosa e assolutamente non confermata da Google, a questo algoritmo è stato assegnato il nome di Phantom.

Nell’aprile di quest’anno pare che Google abbia nuovamente ripassato i suoi indici con una nuova versione di Phantom. Questa volta dal quartier generale del motore di ricerca sono arrivate però le prime ammissioni: “benché non sia stato lanciato alcun aggiornamento legato allo spam, sono stati effettuati dei cambiamenti all’algoritmo nei termini di come processa i segnali relativi alla qualità.”, a seguito delle quali Phantom è stato ribattezzato in Quality Update.

Ma vediamo le caratteristiche del nostro (ex) fantasmino.

Il Phantom del 2013 andò a penalizzare alcuni siti con problemi di crosslink spinto o link in uscita particolarmente abbondanti e poco naturali. Inoltre erano stati riscontrati problemi legati a contenuti copiati in assenza di citazione della fonte. È possibile trovare un’analisi approfondita a questo indirizzo

Intorno al 29 aprile di quest’anno sono comparse ulteriori oscillazioni nelle pagine dei risultati di ricerca e Glenn Gabe ha deciso di chiamare questo update di Google Phantom 2, viste le similitudini che questo aggiornamento aveva con quello avvenuto nel 2013. Sul sito di G-Squared Interactive Gabe analizza a fondo anche Phantasm 2 concentrandosi sulle differenze col primo.

Cosa è andato a colpire il Fantasma questa volta?

  1. 1) Pagine Tag particolarmente “affollate”
    Le pagine tag sono quelle contenenti un elenco di articoli su un determinato argomento. I siti penalizzati da Phantom 2 (aka Quality Update) erano costituiti da pagine di questo tipo con migliaia di link, a volte addirittura con una struttura infinite scroll, che di fatto continuavano a proporre link in maniera automatica. Le pagine di questo tipo restituiscono una pessima user experience e sono molto poco utili.
  2. 2) Click bait, contenuti supplementari di bassa qualità e stacked video
    Un’altra categoria di pagine colpite da Phantom 2 è quella che presenta una bassa qualità dei contenuti. Molte delle pagine colpite utilizzavano il click bait (tecnica poco ortodossa che permette di acquisire visualizzazioni utilizzando titoli ad effetto) o presentavano unicamente un elenco di video affiancati ad annunci pubblicitari (in questo caso i primi sono esclusivamente utilizzati per veicolare i secondi e non per dare un contenuto di qualità all’utente).
  3. 3) Pessimo design e UGC di bassa qualità
    Siti molto vecchi, con font piccoli o comunque bassa qualità grafica non sono sicuramente il massimo se si punta all’eccellenza. Uno dei siti analizzati da Gabe aveva una grafica che risaliva addirittura al 1998. Un altro problema legato all’anzianità del sito è quello relativo ad UGC (User Generated Contents, cioè quei contenuti creati dagli utenti) che quando sono molto vecchi non danno nessun valore aggiunto alla ricerca, anzi a volte la inficiano fornendo informazioni datate.
  4. 4) Directory
    Altra categoria colpita è quella delle directory di scarsa qualità e che presentano molti banner e/o pubblicità invasiva. Anche in questo caso il contenuto è solo un mezzo per veicolare i messaggi pubblicitari che sono il vero fulcro dei siti in questione.
  5. 5) Content Farm
    Le content farm sono quei siti che utilizzano una grande quantità di testo di bassa qualità teso unicamente a soddisfare i motori di ricerca e quindi completamente privi di valore aggiunto per l’utente. Sembra che questi siti, che generalmente presentano pop-up invasivi e poco ortodossi, siano stati particolarmente colpiti da Phantom 2.

Gabe sottolinea come Phantom 2 non sia minimamente collegato all’aggiornamento riguardante il mobile del 21 aprile scorso in quanto numerosi siti penalizzati erano perfettamente mobile friendly. Inoltre i siti in questione erano già stati notati da Panda ma probabilmente la penalizzazione che ne è derivata non era proporzionale alla scarsezza dei contenuti

In un nuovo articolo pubblicato qualche giorno fa, dopo un'ulteriore analisi del funzionamento di Phantasm 2, Gabe ha fatto un'ipotesi riguardante la differenza tra i due algoritmi: Panda ha come obiettivo la penalizzazione di interi siti di bassa qualità (e quindi lavora a livello di dominio) mentre Phantom premia (o penalizza) i contenuti di alta (o bassa) qualità a livello di pagina. L’articolo poi aggiunge nuovi dettagli sul Quality Update, quindi vi consiglio caldamente di dargli un’occhiata.

Faccio un’ipotesi: e se Phantom fosse basato su giudizi umani? Se cioè le penalizzazioni fossero il frutto di un lavoro espletato da editor e non da algoritmi informatici? Se così fosse molti comportamenti insoliti di questo update potrebbero essere spiegati e potrebbe essere spiegata anche la reticenza di Google sull'argomento...

Image by Iamnee at FreeDigitalPhotos.net