HTTrack è un interessantissimo programma free multipiattaforma (esiste per Windows, Linux e Mac OS X) che permette di copiare qualsiasi sito web presente in internet in locale sul proprio pc mantenendone l’aspetto ed i contenuti.
Come dicevamo pur essendo gratuito funziona molto bene e può tornarci utile in tutti quei casi in cui abbiamo bisogno di consultare o salvare offline un intero sito web, anche quando non siamo i proprietari dello stesso e quindi non possiamo accedere al sito ftp dove si trovano i sorgenti.
Funziona anche con i siti dinamici fatti in Php, cgi, asp, javascript, ecc…
L’uso è veramente semplice ed immediato, per Windows ne esiste anche una versione portable che ne semplifica ulteriormente l’uso.
Il programma è scaricabile da qui :
http://www.httrack.com/page/2/
Vediamo come funziona con un semplice esempio, una volta scaricato ed installato all’esecuzione vi troverete una finestra come questa :
premete il bottone AVANTI e ci verrà richiesto di inserire il nome del progetto ed il percorso dove salvare i files del sito web che andiamo a copiare offline sul nostro disco, nel nostro esempio useremo il sito www.esconsulting.it, quindi nel nome progetto metteremo esconsulting.it e nel percorso base C:\Tmp\Web\ :
confermiamo il tutto con AVANTI e nel campo indirizzo web inseriamo l’url completo del sito che vogliamo catturare, quindi : http://www.esconsulting.it
quindi premiamo sempre il bottone AVANTI per proseguire :
se siete connessi direttamente ad Internet (come è di solito) non dovete specificare nessun altro parametro, premete solo il bottone FINE ed il programma inzierà a scandagliare il sito web remoto e a salvare ogni informazione che trova sul vostro disco locale (files html, script, immagini, ecc…) :
l’operazione potrebbe essere piuttosto lunga, dipende da diversi fattori : velocità del vostro pc e della vostra connessione ad Internet, dimensione e velocità di risposta del sito web che state copiando; quindi armatevi di pazienza ed attendete la fine delle operazioni.
Al termine vi apparirà una videata simile a questa in cui il programma vi conferma che ha completato il lavoro.
ora potete premere il bottone FINE e chiudere il programma HTTrack.
Per verificare se è andato tutto bene aprite il file index.html che trovate nel percorso che avete specificato precedentemente, quindi nel nostro esempio sarà in :
C:\Tmp\Web\esconsulting.it\index.html
aprendolo inizierete la navigazione offline del sito web copiato, esempio :
Semplice e comodo, no ?
Ora avete una copia dell’intero sito web sul disco locale della vostra macchina e lo potete portare con voi e far visionare a chiunque anche senza nessuna connessione internet attiva in quel momento, inoltre potete navigarlo sul file system locale se state cercando immagini, informazioni o dati che risultano un pò “nascosti” nella normale navigazione web online del sito.
Rimarrete sorpresi dagli ottimi risultati che si ottengono con HTTrack ed il tutto a costo zero !
Per maggiori informazioni sul programma o per supporto visitate il loro sito :
21 commenti
Vai al modulo dei commenti ↓
Matteo
6 Gennaio 2019 at 14:31 (UTC 2) Link to this comment
Ciao, il sito che ho scaricato con Httrack lo voglio importare su un nuovo dominio. come posso utilizzare questi file per importali online?
mario
6 Gennaio 2019 at 19:30 (UTC 2) Link to this comment
Semplicissimo, sul nuovo dominio avrai un accesso via Ftp o via WebDav, collegati al sito e copia i files che ti interessano sul nuovo sito via Ftp o con un copia e incolla se hai mappato il disco di rete remoto con webdav.
Attenzione a NON sovrascrivere i files di sistema già presenti sul nuovo hosting ma a copiare solo files html, immagini e altri files relativi al sito copiato.
Presta la massima attenzione anche al discorso copyright, il sito che hai copiato offline potrebbe contenere materiale non di pubblico dominio e quindi non replicabile online su un altro sito….
Marco
14 Maggio 2019 at 19:36 (UTC 2) Link to this comment
Salve!
Ho un sito su domini xx.it e vorrei clonarlo sul domnio xy.it.
Come posso fare?
Se lo copio solamente con ftp i link nel nuovo dominio rimarranno quelli del vecchio.
Grazie e cordiali saluti
mdede
14 Maggio 2019 at 21:44 (UTC 2) Link to this comment
Di solito i siti web non usano dei riferimenti assoluti ma relativi, cioè nelle loro pagine html contengono links relativi alla prossima pagina (es.menu\menu1.htm) e non assoluti (es. http://www.dominio.it\menu\menu1.htm) ma ovviamente questa cosa cambia da caso a caso.
Può fare una prova scaricando il sito web in locale e poi aprendo il primo file indice dal file system direttamente (di solito si chiama index.htm, home.htm o qualcosa di simile), quindi provi a navigare nel sito, vedrà nel browser degli indirizzi del tipo file:///C:/percorso/dominio/index.htm ; se riesce a navigare tutto il sito senza problemi anche da file system significa che è statico ed usare link relativi quindi non dovrebbero esserci problemi a ricaricarlo via ftp su un altro indirizzo, se invece non carica alcune pagine andranno controllati i sorgenti html delle pagine web che lo compongono e cambiati gli indirizzi dal vecchio link assoluto xx.it al nuovo xy.it
Saluti
Valeria
30 Novembre 2021 at 10:39 (UTC 2) Link to this comment
Buongiorno, ho utilizzato htttrack per copiare un sitoweb che attualmente non è on line. Volevo sapere come possono rendere on line in futuro questa copia che ora ho su htttrack.
Grazie
mdede
30 Novembre 2021 at 13:49 (UTC 2) Link to this comment
Se ha la copia del sito web basta ripubblicarla (copiarla via Ftp o web drive) su qualsiasi servizio di Hosting internet per rimettere online il sito.
Saluti.
Roberto
19 Maggio 2020 at 15:31 (UTC 2) Link to this comment
Se la pagina contiene più risultati che si caricano scorrendo verso il basso come si fa a salvare tutta la pagina completa con i risultati caricati fino alla fine?
mdede
19 Maggio 2020 at 21:05 (UTC 2) Link to this comment
Httrack dovrebbe riuscire a “catturare” tutta la pagina web, anche la parte nascosta che viene visualizzata dall’utente solo scrollando verso il basso, ha provato ?
Saluti.
mauro
5 Giugno 2020 at 11:10 (UTC 2) Link to this comment
Salve. Scaricato il sito le immagini risultano però sfocate. Come posso risolvere il problema?
Grazie
mdede
5 Giugno 2020 at 12:58 (UTC 2) Link to this comment
Non ho mai avuto questo problema, forse è dovuto al tipo di browser-agent con cui si “presenta” Httrack verso il sito web per il download delle pagine, provi a cambiare agent, lo trova nelle opzioni del progetto prima di confermare l’inizio dello scaricamento del sito.
Se usa Httrack in italiano è :
Definisci le opzioni -> Identità del browser -> Identità = Mozilla 4.5
se in inglese :
Set options -> Browser ID -> Browser identity =
provi a commutare sull’agent Mozilla 4 / MSIE6 (o altre varianti, ce ne sono diverse) e rifaccia la cattura, come le dicevo non mi è mai capitato questo effetto….
Saluti
Carlo
9 Giugno 2020 at 17:16 (UTC 2) Link to this comment
Salve.
Piccola informazione: scaricato un sito è possibile modificarlo ? se si con quale programma?
mdede
9 Giugno 2020 at 21:32 (UTC 2) Link to this comment
Puo’ usare qualsiasi programma editor che supporti il codice HTML, quelli per programmatori lo fanno tutti, ne avevamo descritti alcuni qui :
https://www.trickit.it/linux/editors-per-programmatori
oppure può usare gli editors specifici per il codice HTML, alcuni tra i più diffusi sono :
http://bluegriffon.org/
https://html-notepad.com/
https://ckeditor.com/
Ovviamente molto dipende anche dalla complessità delle pagine web del sito che ha scaricato e dal codice che contengono.
Saluti.
Sara
1 Aprile 2022 at 10:46 (UTC 2) Link to this comment
si può scaricare un sito che all’accesso è protetto da password?
mdede
1 Aprile 2022 at 13:37 (UTC 2) Link to this comment
Si, dovrebbe essere possibile una volta autenticati sul sito web da scaricare, lo può fare specificando l’URL completo di login e password in Httrack usando questa sintassi :
<http://username:password@www.website.com>
oppure con le opzioni di Httrack descritte qui :
http://httrack.kauler.com/help/CatchURL_tutorial
http://httrack.kauler.com/help/Authentication
https://www.techwalla.com/articles/how-to-configure-httrack-for-a-website-with-password-protection
Sono da provare però perchè non ho avuto modo di verificarle di persona.
Saluti.
vincenzo
8 Settembre 2022 at 15:27 (UTC 2) Link to this comment
ciao volevo scaricare un sito ma scarica quasi nulla può essere che sia protetto scarica giusto qualche file, ma non esce nulla di che e non si vede nulla se apro index la pagina e vuota, mai successo ho sempre copiato i siti
mdede
8 Settembre 2022 at 17:32 (UTC 2) Link to this comment
Mi sembra strano che un sito sia “protetto”, forse contiene del codice che controlla l’agent con cui si collega il programma e blocca il download, provi a verificare il codice sorgente della pagina e veda se c’e’ qualche codice strano javascript (o altro) , lo può fare con qualsiasi browser, una volta sulla pagina del sito che le interessa prema
CTRL+U
per vedere il sorgente html della pagina web
Nel caso posti qui il sito web e vediamo se è veramente bloccato per il download, anche se sembra improbabile.
Saluti.
Vincenzo
8 Settembre 2022 at 18:33 (UTC 2) Link to this comment
Il sito in questione è gruppopiccirillo.it, il download incomincia ma a 18 file da un errore puoi controllare stesso tu, magari riesci a capire il problema, grazie
mdede
9 Settembre 2022 at 13:40 (UTC 2) Link to this comment
Le confermo che il sito non è copiabile, in pratica le pagine web html non sono statiche ma vengono generate dinamicamente attraverso del codice javascript che probabilmente fa qualche controllo per verificare che la pagina si stia caricando all’interno di un browser e non da altro programma.
Saluti.
Vincenzo
8 Settembre 2022 at 19:01 (UTC 2) Link to this comment
Con un altro programma sono riuscito a copiarlo, almeno così sembra, escono molti file e non mi da nessun errore durante il processo, ma comunque quando cerco di aprire una delle pagine html del sito la schermata e bianca, ricapitolando mentre httrack da errore e non copia quasi nulla e la schermata e bianca, con quest’altro programma nonostante copi tutto o quasi le schermate sono sempre bianche.
Luca
3 Dicembre 2022 at 20:51 (UTC 2) Link to this comment
, io volevo copiare un sito Html , peró é protetto da un Token che devo usare per accedere, solo che questo token lo pago 200€ al mese, il sito é semplice é solo una calcolatrice in cui scrivo numeri e mi fa dei calcoli , é possibile copiarlo il sito in offline con questo programma? Ho scoperto anche che una volta inserito il token e si é dentro il sito dove c é la calcolatrice, fa i calcoli anche se non si é piu connessi ad internet anche in offline ma una volta aggiornata la pagina richiede di nuovo di inserire questo token per accedere
mdede
4 Dicembre 2022 at 17:26 (UTC 2) Link to this comment
Difficile rispondere senza avere il link del sito web, probabilmente il token sblocca o decripta del codice javascript che si trova in forma protetta sulla pagina web, controlli il codice della pagina web con CTRL+U una volta che ha inserito il token , ma se han fatto le cose per bene non sarà possibile comunque copiare la pagina protetta.
Saluti.