Vytvořte si offline zrcadlovou kopii webu s Wgetem pro Windows a Linux
Někdy potřebujete získat kopii webové stránky, kterou lze procházet, abyste k ní mohli přistupovat offline, nasadit USB klíčenku nebo ji dokonce nahrát do svého smartphonu a přečíst si ji během letu nebo cestování. I když je v moderních prohlížečích a operačních systémech snadné uložit webovou stránku do PDF, může být nepříjemné zpracovat každou stránku. Přichází wget.
Reklama
Wget je správce stahování s otevřeným zdrojovým kódem. Je to konzolová aplikace vyvinutá primárně pro Linux, ale úspěšně portovaná na jiné operační systémy, včetně Windows a MacOS.
Google Play Fire TV bez root
Pokud nejste obeznámeni s wget, měli byste to určitě vyzkoušet. Je to velmi silné. Umožňuje načítání souborů z webových stránek pomocí HTTP, HTTPS a FTP, internetových protokolů, které dnes používáme. Jeho chování je řízeno argumenty příkazového řádku.
Wget podporuje celou řadu možností načtení souborů na pomalých nebo nestabilních připojeních, včetně opakování, pokračování tam, kde zbylo, a další. Podporuje soubor „robots.txt“, takže může fungovat jako webový prohledávač. Může načíst pouze upravené soubory, podporuje zástupné znaky, limity typů souborů a běžné přípony.
Wget podporuje rekurzivní načítání webových stránek HTML a serverů FTP, což vám umožňuje vytvořit zrcadlo webových stránek. Zde je možné to udělat.
Než budete pokračovat, musíte si stáhnout aplikaci wget.
Získejte Wget ve Windows
Obvykle používám binární soubory z těchto zdrojů:
Oba dělají svou práci.
Získejte Wget v systému Linux
Použijte správce balíčků vaší distribuce. Některé příklady (běh jako root ):
Debian / Ubuntu / Mint:
apt install wget
CentOS / Redhat
yum nainstalovat wget
Arch Linux
pacman - Sy wget
Zrušit Linux
xbps-install -S wget
Chcete-li vytvořit offline kopii webu pomocí Wget,
- otevřeno příkazový řádek / terminál .
- V systému Windows zadejte úplnou cestu k souboru wget.exe.
- V systému Linux zadejte pouze wget.
- Nyní zadejte následující argumenty a získejte následující příkaz:
wget --mirror --convert-links --adjust-extension --page-Requisites --no-parent https://site-to-download.com
- Nahradit
https://site-to-download.com
část se skutečnou adresou URL, ze které chcete udělat zrcadlo.
Jsi hotov!
Zde jsou přepínače, které používáme:
--zrcadlo
- použije řadu možností, aby bylo stahování rekurzivní.- žádný rodič
- Neprocházejte nadřazeným adresářem, abyste získali pouze část webu.--convert-links
- vytvoří všechny odkazy, aby správně fungovaly s offline kopií.--požadavky na stránku
- stahujte soubory JS a CSS, abyste si při procházení místního zrcadla zachovali původní styl stránky.--adjust-extension
- přidá příslušné přípony (např. html, css, js) do souborů, pokud byly načteny bez nich.
A je to.