Guida Semalt sull'estensione del raschietto per Chrome

Perché qualsiasi azienda sopravviva e alla fine cresca, è necessario stare al passo con i suoi concorrenti e vari rischi. Prendere decisioni basate su dati analitici è un modo sicuro per dimenticare questi problemi. Tali dati possono essere acquisiti mediante la cancellazione dei dati. È qui che arriva l' estensione di raschietto facile per Chrome: non solo faciliterà il processo di raccolta dei dati, ma consentirà anche di raschiare in movimento senza complicate configurazioni.

Come usare Scraper

    1. La prima cosa che devi fare è installare l'estensione, quindi vai al Chrome Web Store, cerca "raschietto" e fai clic su Aggiungi a Chrome.

    2. Passare al sito Web da cui si desidera acquisire dati , contrassegnare la voce che si desidera evidenziandola. Fai clic destro su di esso e seleziona "raschia simile" dal menu che si apre.

    3. In questo modo verrà avviata una finestra della console di scraper separata. Qui, vedrai un elenco dei dati raschiati .

    4. Per salvare il contenuto, fai clic su "Salva in documenti Google", questo esporterà automaticamente i dati in un foglio di calcolo di Google.

Raschiatura estesa

Nel caso in cui si preveda di acquisire più dati, è possibile utilizzare l'approccio avanzato. Nota, sarà molto più semplice lavorare con lo strumento se hai qualche conoscenza dell'HTML. Supponiamo che tu voglia raschiare dati da una fonte che ha un archivio basato su dati di serie temporali. In tal caso, se provi il metodo sopra descritto, otterrai i dati confusi.

Per risolvere questo problema, è possibile utilizzare un linguaggio di query HTML e XML noto come XPath. Che cosa fa? XPath riconosce i dati relativi ai diversi elementi contenuti in ciascuna selezione. Di seguito è una guida su come procedere:

1. Vai alla console Scraper, in alto a sinistra dovresti notare un pulsante "XPath", fai clic su di esso e procedi con il montaggio della tabella iniziale.

2. Devi scrivere XPath per l'elemento giusto. L'attuale XPath che include tutte le informazioni verrà visualizzato in un formato come questo "// div [3] / div [3] / div [2] / div". Gli elementi <div> saranno riconosciuti nel documento HTML dal computer.

3. Per separare i dati riconosciuti, è necessario utilizzare le colonne Scraper. Per fare ciò, è necessario cercare i diversi tipi di informazioni disponibili. A seconda dei dati che stai raschiando potresti avere dei titoli. Questi titoli sono presenti accanto a ogni set di dati. Sono accompagnati da un tag, in questo caso un tag <b>.

4. Utilizzando l'elemento inspect, individuare e aggiungere il tag <b> a XPath. Ora puoi etichettare questa prima colonna come "colonna del titolo" in quanto elencherà i titoli. Procedi con la creazione di XPath diversi per ogni colonna di cui hai bisogno.

5. Fare clic sul raschiamento e l'estensione raccoglierà automaticamente i dati e li organizzerà nelle diverse colonne impostate.

send email