«

»

Mag 26

Copiare offline un intero sito web con HTTrack

HTTrack è un interessantissimo programma free multipiattaforma (esiste per Windows, Linux e Mac OS X) che permette di copiare qualsiasi sito web presente in internet in locale sul proprio pc mantenendone l’aspetto ed i contenuti.

 

Come dicevamo pur essendo gratuito funziona molto bene e può tornarci utile in tutti quei casi in cui abbiamo bisogno di consultare o salvare offline un intero sito web, anche quando non siamo i proprietari dello stesso e quindi non possiamo accedere al sito ftp dove si trovano i sorgenti.

Funziona anche con i siti dinamici fatti in Php, cgi, asp, javascript, ecc…

L’uso è veramente semplice ed immediato, per Windows ne esiste anche una versione portable che ne semplifica ulteriormente l’uso.

Il programma è scaricabile da qui :

http://www.httrack.com/page/2/

 

Vediamo come funziona con un semplice esempio, una volta scaricato ed installato all’esecuzione vi troverete una finestra come questa :

premete il bottone AVANTI e ci verrà richiesto di inserire il nome del progetto ed il percorso dove salvare i files del sito web che andiamo a copiare offline sul nostro disco, nel nostro esempio useremo il sito www.esconsulting.it, quindi nel nome progetto metteremo esconsulting.it e nel percorso base C:\Tmp\Web\ :

confermiamo il tutto con AVANTI e nel campo indirizzo web inseriamo l’url completo del sito che vogliamo catturare, quindi : http://www.esconsulting.it

quindi premiamo sempre il bottone AVANTI per proseguire :

se siete connessi direttamente ad Internet (come è di solito) non dovete specificare nessun altro parametro, premete solo il bottone FINE ed il programma inzierà a scandagliare il sito web remoto e a salvare ogni informazione che trova sul vostro disco locale (files html, script, immagini, ecc…) :

l’operazione potrebbe essere piuttosto lunga, dipende da diversi fattori : velocità del vostro pc e della vostra connessione ad Internet, dimensione e velocità di risposta del sito web che state copiando; quindi armatevi di pazienza ed attendete la fine delle operazioni.

Al termine vi apparirà una videata simile a questa in cui il programma vi conferma che ha completato il lavoro.

ora potete premere il bottone FINE e chiudere il programma HTTrack.

Per verificare se è andato tutto bene aprite il file index.html che trovate nel percorso che avete specificato precedentemente, quindi nel nostro esempio sarà in :

C:\Tmp\Web\esconsulting.it\index.html

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

aprendolo inizierete la navigazione offline del sito web copiato, esempio :

 

Semplice e comodo, no ?

Ora avete una copia dell’intero sito web sul disco locale della vostra macchina e lo potete portare con voi e far visionare a chiunque anche senza nessuna connessione internet attiva in quel momento, inoltre potete navigarlo sul file system locale se state cercando immagini, informazioni o dati che risultano un pò “nascosti” nella normale navigazione web online del sito.

Rimarrete sorpresi dagli ottimi risultati che si ottengono con HTTrack ed il tutto a costo zero !

Per maggiori informazioni sul programma o per supporto visitate il loro sito :

https://www.httrack.com/

 

21 commenti

Vai al modulo dei commenti

  1. Matteo

    Ciao, il sito che ho scaricato con Httrack lo voglio importare su un nuovo dominio. come posso utilizzare questi file per importali online?

    1. mario

      Semplicissimo, sul nuovo dominio avrai un accesso via Ftp o via WebDav, collegati al sito e copia i files che ti interessano sul nuovo sito via Ftp o con un copia e incolla se hai mappato il disco di rete remoto con webdav.
      Attenzione a NON sovrascrivere i files di sistema già presenti sul nuovo hosting ma a copiare solo files html, immagini e altri files relativi al sito copiato.
      Presta la massima attenzione anche al discorso copyright, il sito che hai copiato offline potrebbe contenere materiale non di pubblico dominio e quindi non replicabile online su un altro sito….

  2. Marco

    Salve!
    Ho un sito su domini xx.it e vorrei clonarlo sul domnio xy.it.
    Come posso fare?
    Se lo copio solamente con ftp i link nel nuovo dominio rimarranno quelli del vecchio.

    Grazie e cordiali saluti

    1. mdede

      Di solito i siti web non usano dei riferimenti assoluti ma relativi, cioè nelle loro pagine html contengono links relativi alla prossima pagina (es.menu\menu1.htm) e non assoluti (es. http://www.dominio.it\menu\menu1.htm) ma ovviamente questa cosa cambia da caso a caso.
      Può fare una prova scaricando il sito web in locale e poi aprendo il primo file indice dal file system direttamente (di solito si chiama index.htm, home.htm o qualcosa di simile), quindi provi a navigare nel sito, vedrà nel browser degli indirizzi del tipo file:///C:/percorso/dominio/index.htm ; se riesce a navigare tutto il sito senza problemi anche da file system significa che è statico ed usare link relativi quindi non dovrebbero esserci problemi a ricaricarlo via ftp su un altro indirizzo, se invece non carica alcune pagine andranno controllati i sorgenti html delle pagine web che lo compongono e cambiati gli indirizzi dal vecchio link assoluto xx.it al nuovo xy.it

      Saluti

    2. Valeria

      Buongiorno, ho utilizzato htttrack per copiare un sitoweb che attualmente non è on line. Volevo sapere come possono rendere on line in futuro questa copia che ora ho su htttrack.
      Grazie

      1. mdede

        Se ha la copia del sito web basta ripubblicarla (copiarla via Ftp o web drive) su qualsiasi servizio di Hosting internet per rimettere online il sito.
        Saluti.

  3. Roberto

    Se la pagina contiene più risultati che si caricano scorrendo verso il basso come si fa a salvare tutta la pagina completa con i risultati caricati fino alla fine?

    1. mdede

      Httrack dovrebbe riuscire a “catturare” tutta la pagina web, anche la parte nascosta che viene visualizzata dall’utente solo scrollando verso il basso, ha provato ?

      Saluti.

  4. mauro

    Salve. Scaricato il sito le immagini risultano però sfocate. Come posso risolvere il problema?
    Grazie

    1. mdede

      Non ho mai avuto questo problema, forse è dovuto al tipo di browser-agent con cui si “presenta” Httrack verso il sito web per il download delle pagine, provi a cambiare agent, lo trova nelle opzioni del progetto prima di confermare l’inizio dello scaricamento del sito.

      Se usa Httrack in italiano è :

      Definisci le opzioni -> Identità del browser -> Identità = Mozilla 4.5

      se in inglese :

      Set options -> Browser ID -> Browser identity =

      provi a commutare sull’agent Mozilla 4 / MSIE6 (o altre varianti, ce ne sono diverse) e rifaccia la cattura, come le dicevo non mi è mai capitato questo effetto….

      Saluti

  5. Carlo

    Salve.
    Piccola informazione: scaricato un sito è possibile modificarlo ? se si con quale programma?

    1. mdede

      Puo’ usare qualsiasi programma editor che supporti il codice HTML, quelli per programmatori lo fanno tutti, ne avevamo descritti alcuni qui :

      https://www.trickit.it/linux/editors-per-programmatori

      oppure può usare gli editors specifici per il codice HTML, alcuni tra i più diffusi sono :

      http://bluegriffon.org/

      https://html-notepad.com/

      https://ckeditor.com/

      Ovviamente molto dipende anche dalla complessità delle pagine web del sito che ha scaricato e dal codice che contengono.

      Saluti.

  6. Sara

    si può scaricare un sito che all’accesso è protetto da password?

    1. mdede

      Si, dovrebbe essere possibile una volta autenticati sul sito web da scaricare, lo può fare specificando l’URL completo di login e password in Httrack usando questa sintassi :

      <http://username:password@www.website.com>

      oppure con le opzioni di Httrack descritte qui :

      http://httrack.kauler.com/help/CatchURL_tutorial

      http://httrack.kauler.com/help/Authentication

      https://www.techwalla.com/articles/how-to-configure-httrack-for-a-website-with-password-protection

      Sono da provare però perchè non ho avuto modo di verificarle di persona.

      Saluti.

  7. vincenzo

    ciao volevo scaricare un sito ma scarica quasi nulla può essere che sia protetto scarica giusto qualche file, ma non esce nulla di che e non si vede nulla se apro index la pagina e vuota, mai successo ho sempre copiato i siti

    1. mdede

      Mi sembra strano che un sito sia “protetto”, forse contiene del codice che controlla l’agent con cui si collega il programma e blocca il download, provi a verificare il codice sorgente della pagina e veda se c’e’ qualche codice strano javascript (o altro) , lo può fare con qualsiasi browser, una volta sulla pagina del sito che le interessa prema
      CTRL+U
      per vedere il sorgente html della pagina web
      Nel caso posti qui il sito web e vediamo se è veramente bloccato per il download, anche se sembra improbabile.
      Saluti.

      1. Vincenzo

        Il sito in questione è gruppopiccirillo.it, il download incomincia ma a 18 file da un errore puoi controllare stesso tu, magari riesci a capire il problema, grazie

        1. mdede

          Le confermo che il sito non è copiabile, in pratica le pagine web html non sono statiche ma vengono generate dinamicamente attraverso del codice javascript che probabilmente fa qualche controllo per verificare che la pagina si stia caricando all’interno di un browser e non da altro programma.
          Saluti.

  8. Vincenzo

    Con un altro programma sono riuscito a copiarlo, almeno così sembra, escono molti file e non mi da nessun errore durante il processo, ma comunque quando cerco di aprire una delle pagine html del sito la schermata e bianca, ricapitolando mentre httrack da errore e non copia quasi nulla e la schermata e bianca, con quest’altro programma nonostante copi tutto o quasi le schermate sono sempre bianche.

  9. Luca

    , io volevo copiare un sito Html , peró é protetto da un Token che devo usare per accedere, solo che questo token lo pago 200€ al mese, il sito é semplice é solo una calcolatrice in cui scrivo numeri e mi fa dei calcoli , é possibile copiarlo il sito in offline con questo programma? Ho scoperto anche che una volta inserito il token e si é dentro il sito dove c é la calcolatrice, fa i calcoli anche se non si é piu connessi ad internet anche in offline ma una volta aggiornata la pagina richiede di nuovo di inserire questo token per accedere

    1. mdede

      Difficile rispondere senza avere il link del sito web, probabilmente il token sblocca o decripta del codice javascript che si trova in forma protetta sulla pagina web, controlli il codice della pagina web con CTRL+U una volta che ha inserito il token , ma se han fatto le cose per bene non sarà possibile comunque copiare la pagina protetta.
      Saluti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>