In un recente post su LinkedIn, l’analista di Google Gary Illyes ha sollevato la questione di due problemi che affliggono i web crawler: gli errori soft 404 e altri errori “crypto”.
Questi errori apparentemente innocui possono influire negativamente sugli sforzi SEO.
Comprensione dei Soft 404
Gli errori soft 404 si verificano quando un server web restituisce un codice di stato HTTP standard “200 OK” per pagine che non esistono o contengono messaggi di errore. Ciò fuorvia i web crawler, inducendoli a sprecare risorse su contenuti inesistenti o inutili.
Illyes ha paragonato l’esperienza alla visita a una caffetteria in cui ogni articolo non è disponibile nonostante sia elencato nel menu. Mentre questo scenario potrebbe essere frustrante per i clienti umani, pone un problema più serio per i web crawler.
Come Illyes spiega:
“I crawler usano i codici di stato per interpretare se un recupero è riuscito, anche se il contenuto della pagina è fondamentalmente solo un messaggio di errore. Potrebbero tornare volentieri alla stessa pagina più e più volte sprecando le tue risorse e, se ci sono molte di queste pagine, esponenzialmente più risorse.”
I costi nascosti degli errori soft
Le conseguenze degli errori soft 404 vanno oltre l’uso inefficiente delle risorse del crawler.
Secondo Illyes, è improbabile che queste pagine compaiano nei risultati di ricerca perché vengono filtrate durante l’indicizzazione.
Per risolvere questo problema, Illyes consiglia di fornire il codice di stato HTTP appropriato quando il server o il client riscontra un errore.
Ciò consente ai crawler di comprendere la situazione e allocare le proprie risorse in modo più efficace.
Illyes ha anche messo in guardia contro i crawler che limitano la velocità con messaggi come “TROPPE RICHIESTE RALLENTANO”, poiché i crawler non possono interpretare tali istruzioni basate su testo.
Perché SEJ si preoccupa
Gli errori soft 404 possono influire sulla scansionabilità e sull’indicizzazione di un sito web.
Risolvendo questi problemi, i crawler possono concentrarsi sul recupero e sull’indicizzazione delle pagine con contenuti di valore, migliorando potenzialmente la visibilità del sito nei risultati di ricerca.
L’eliminazione degli errori soft 404 può anche portare a un utilizzo più efficiente delle risorse del server, poiché i crawler non sprecheranno larghezza di banda visitando ripetutamente le pagine di errore.
Come questo può aiutarti
Per identificare e risolvere gli errori soft 404 sul tuo sito web, prendi in considerazione i seguenti passaggi:
- Monitora regolarmente i report e i log di scansione del tuo sito web per identificare le pagine che restituiscono codici di stato HTTP 200 nonostante contengano messaggi di errore.
- Implementa una corretta gestione degli errori sul tuo server per garantire che le pagine di errore vengano fornite con i codici di stato HTTP appropriati (ad esempio, 404 per non trovato, 410 per rimosso in modo permanente).
- Utilizza strumenti come Google Search Console per monitorare la copertura del tuo sito e identificare le pagine contrassegnate come errori soft 404.
L’affrontamento proattivo degli errori soft 404 può migliorare la crawlability del tuo sito webindicizzazione e SEO.
Immagine in primo piano: Julia Tim/Shutterstock