structured_scraper/example
2022-01-08 15:37:53 +01:00
..
pagina1 Aggiornamento file di test 2022-01-08 15:36:00 +01:00
pagina2 Fix file di test 2022-01-08 15:37:53 +01:00
index.html Aggiornamento file di test 2022-01-08 15:36:00 +01:00
README.md Aggiornamento file di test 2022-01-08 15:36:00 +01:00

Esempio

Copia questa cartella nel tuo web server in modo che sia raggiungibile ad esempio a questa URL:

http://localhost/example

Copia anche il file example/config.php nella root dello scraper, così da configurare l'URL e come filtri di ricerca ad ogni livello di profondità un semplice tag <a> per il test.

Inserendo negli $start_url l'indirizzo sopra e avviando lo script, l'output dovrebbe essere:

[0] http://localhost/example/pagina1
[1] http://localhost/example/pagina1/sub1.1
[1] http://localhost/example/pagina1/sub1.2
[1] http://localhost/example/pagina1/sub1.3
[2] http://localhost/example/pagina1/sub1.1/subsub1.1.1
[2] http://localhost/example/pagina1/sub1.1/subsub1.1.2
[0] http://localhost/example/pagina2
[1] http://localhost/example/pagina2/sub2.1
[1] http://localhost/example/pagina2/sub2.2
[1] http://localhost/example/pagina2/sub2.3