Advertisement
pusatdata

LINUX: Kode Kuras Web dengan WGET

May 25th, 2015
365
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.50 KB | None | 0 0
  1. Kodenya:
  2.  
  3. wget \
  4. --recursive \
  5. --convert-links \
  6. --adjust-extension \
  7. --page-requisites \
  8. --span-hosts \
  9. -e robots=off \
  10. --timestamping \
  11. --domains=software.endy.muhardin.com \
  12. http://software.endy.muhardin.com
  13.  
  14. Cara penggunaan, tinggal copy paste aja di putty
  15.  
  16. Keterangan di atas:
  17. Penjelasan opsi:
  18.  
  19. 1. recursive : tiap ada link di halaman web, link tersebut ikut diunduh
  20. 2. convert-links : ubah link (halaman lain, gambar, javascript, dsb) menjadi link lokal, supaya dia tidak mengarah ke internet
  21. 3. adjust-extension : bila ada link yang dinamis seperti cgi, asp, php, konversi menjadi extension statis seperti html
  22. 4. page-requisites : unduh semua kebutuhan halaman supaya tampilannya sesuai asli (misalnya gambar, stylesheet, dsb)
  23. 5. span-hosts : banyak orang (termasuk saya) menghosting gambar di layanan publik seperti flickr, google plus, dan lainnya. Opsi ini menyuruh wget supaya link di luar website saya juga diunduh
  24. 6. robots=off : ada beberapa website yang melarang halaman dibuka selain oleh browser. Opsi ini perlu supaya larangan tersebut diabaikan
  25. 7. timestamping : timestamp tiap file diset sesuai di server. Ini memungkinkan kita untuk menjalankan lagi wget di lain hari untuk mengupdate website yang sudah pernah kita unduh. Dengan opsi ini, file yang sudah diunduh tidak akan diunduh ulang. Menghemat bandwidth dan waktu
  26. 8. domains : membatasi halaman yang diunduh hanya untuk domain tertentu
  27. URL website yang ingin diambil. Pada contoh di atas adalah http://software.endy.muhardin.com
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement