Så här laddar du ner alla sidor på en webbplats i Linux

Wget är kraftfull öppen källkodsprogramvara på Linux som kan användas för att hämta innehåll från webbplatser. Ibland är det nödvändigt att göra en kopia av allt innehåll på en webbplats, kanske för att skapa en spegel på webbplatsen eller för att bevara det aktuella innehållet för senare användning. Med Wget kan en hel webbplats laddas ner med ett enda kommandot med en rad.

1.

Se till att wget är installerat med kommandot "which". Att skriva "vilken wget", utan citat, i en terminal kommer att visa var Wget är installerat på Linux-datorer. Om Wget inte är installerat, använd distributionens programvaruinstallationsverktyg som Yum eller Apt-installera Wget.

2.

Ställ in flaggan för att spegla webbplatsen. Wget har flera flaggor som kan ställas in för att ändra programmets beteende. "-M" -flaggan används för nedladdning av en hel webbplats. Skriv till exempel:

wget -m www.fake-web-site.com

Detta skapar en lokal kopia av "www.fake-web-site.com" på din dator. Som standard skapar Wget en katalog med samma namn som webbplatsen i katalogen där den exekverades.

3.

Kontrollera att innehållet har förvärvats genom att öppna den lokala kopian av sidan i en webbläsare.

Saker som behövs

  • wget

varningar

  • Wget kan konsumera en betydande mängd bandbredd när man begär innehåll från en server. Vissa brandväggar kan också tolka snabba förfrågningar från en enskild klient som en attack, vilket kan leda till att din IP-adress tillfälligt blockeras från servern. Kontrollera att -w-flaggan är inställd för att begränsa tiden mellan förfrågningar. Till exempel:
  • wget -m -w 10 www.fake-web-site.com
  • kommer att göra Wget vänta i 10 sekunder innan du begär efterföljande filer från servern.

Populära Inlägg