Google lancia il codice sorgente per parser robots.txt in Java e il framework di test in C++

La novità proposta dal team di Search Open Sourcing di Google.

L’anno scorso, Google apriva il codice per parser robots.txt utilizzato nei suoi sistemi di sviluppo. Dopo aver visto la comunità costruire strumenti con esso e aggiungere i propri contributi alla libreria open source, comprese le porte di lingua del parser originale scritto in C++ a golang e rust, Google ha annunciato questa settimana di aver rilasciato ulteriori programmi correlati al codice sorgente.

Ecco cosa c’è di nuovo per gli sviluppatori e i SEO tech con cui lavorare.

C+++ e Java. Per chiunque scriva il proprio o adotti il parser di Google scritto in C+++ (un linguaggio compilato super veloce), Google ha rilasciato il codice sorgente per il framework per i test di validazione del parser robots.txt utilizzato per garantire che i risultati del parser aderiscano alle specifiche ufficiali di robots.txt come previsto, e che possa validare i parser scritti in un’ampia varietà di altri linguaggi.

Inoltre, Google ha fornito una porta ufficiale per il più popolare linguaggio Java. Il Java moderno è più diffuso nelle applicazioni aziendali rispetto al C+++, il C++ è più tipicamente utilizzato nelle applicazioni di system core dove le esigenze di performance lo richiedono. Alcuni codici Java-based eseguono oggi applicazioni per il SEO aziendale e/o software di marketing.

Test e verifica. I requisiti per l’esecuzione del framework di test includono JDK 1.7+ per Apache Maven e il buffer di protocollo di Google per interfacciare il framework di test con la vostra piattaforma parser e la vostra workstation di sviluppo. Dovrebbe essere utile a chiunque sviluppi il proprio parser, convalidi un port, o utilizzi uno dei parser ufficiali di Google, e soprattutto per verificare lo sviluppo di un port su un nuovo linguaggio.

Quanto sarà difficile da utilizzare? Bisogna considerare che si tratta di progetti interni di Google relativamente accessibili, che dovrebbero essere di consumo da parte di programmatori di livello da moderato a superiore in uno o più di questi linguaggi. È possibile costruire un parser robots.txt usando praticamente qualsiasi linguaggio di programmazione. Questo aggiunge perceived authority, quando la vostra applicazione di marketing esegue lo stesso identico parser che regola Googlebot.

Perché ci interessa. Se voi, o la vostra azienda, avete in programma di scrivere o avete scritto un crawler che analizza i file robots.txt per le direttive di ricerca di informazioni importanti (non solo) per il SEO, allora questo vi incentiverà a valutare se vale la pena utilizzare il parser di Google in C++, Java, o una delle altre interfacce di linguaggio. Il parser Java in particolare dovrebbe essere relativamente facile da adottare se la vostra applicazione è già scritta in Java.

Liberamente ispirato e tradotto da:
Google opens the source for its robots.txt parser in Java and testing framework in C++ (fonte: Search Engine Land)

Redazione

Redazione

Lascia un Commento