Protokolovanie a kľúče vstupného súboru. Uložte súbor pod iným názvom

  • 11.04.2019

Všetci niekedy sťahujeme súbory z internetu. Ak na to používate programy GUI, potom sa všetko ukáže ako mimoriadne jednoduché. Pri práci na príkazovom riadku Linuxu sa však veci trochu skomplikujú. Najmä - pre tých, ktorí nie sú oboznámení s vhodnými nástrojmi. Jedným z takýchto nástrojov je mimoriadne výkonný nástroj wget, ktorý je vhodný pre všetky druhy sťahovania. Upozorňujeme na dvanásť príkladov, po ich analýze môžete zvládnuť hlavné funkcie wget.

$ wget https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
Po zadaní takéhoto príkazu sa začne sťahovanie Nagios Core. Počas tohto procesu budete môcť vidieť údaje o stiahnutí, napríklad - informácie o tom, koľko dát už bolo stiahnutých, aktuálna rýchlosť a koľko času zostáva do konca sťahovania.

2. Stiahnite si súbor a uložte ho pod novým názvom

Ak chceme stiahnutý súbor uložiť s názvom odlišným od jeho pôvodného názvu, príde vhod príkaz wget s voľbou -O:

$ wget -O nagios_latest https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
S týmto prístupom bude stiahnutý súbor uložený pod názvom nagios_latest .

3. Obmedzte rýchlosť sťahovania súborov

V prípade potreby je možné obmedziť rýchlosť sťahovania súborov pomocou wget. V dôsledku toho táto operácia nezaberie celý dostupný kanál prenosu údajov a neovplyvní ostatné procesy spojené so sieťou. Môžete to urobiť pomocou voľby --limit-rate a špecifikovaním limitu rýchlosti vyjadreného v bajtoch (ako bežné číslo), kilobajtoch (pridaním K za číslo) alebo megabajtoch (M) za sekundu:

$ wget --limit-rate=500K https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror = vynikajúce médiá
Limit rýchlosti sťahovania je nastavený na 500 Kb/s.

4. Dokončenie prerušeného sťahovania

Ak sa táto operácia počas sťahovania súborov preruší, môžete sťahovanie obnoviť pomocou voľby -c príkazu wget:

$ wget –c https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia
Ak sa tento parameter nepoužije, sťahovanie nedostatočne stiahnutého súboru začne od začiatku.

Ak nahrávate veľký súbor a chcete to urobiť na pozadí, môžete tak urobiť pomocou voľby -b:

$ wget –b https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Ak máte zoznam adries URL pre súbory na stiahnutie, ale nechcete manuálne spúšťať sťahovanie týchto súborov, môžete použiť možnosť -I. Pred začatím sťahovania však musíte vytvoriť súbor obsahujúci všetky adresy. Môžete to urobiť napríklad pomocou nasledujúceho príkazu:

$ vi url.txt
Do tohto súboru musíte vložiť adresy - jednu do každého riadku. Ďalej zostáva len spustiť wget , odovzdať tomuto nástroju novovytvorený súbor so zoznamom stiahnutí:

$ wget -I url.txt
Vykonaním tohto príkazu sa postupne stiahnu všetky súbory v zozname.

7. Zvýšte celkový počet pokusov o stiahnutie súboru

Na nastavenie počtu pokusov o nahranie súboru môžete použiť možnosť --tries:

wget --tries=100 https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Príkaz na stiahnutie súboru z anonymného FTP servera pomocou wget vyzerá takto:

$ wget FTP-URL
Ak sa na prístup k súboru vyžaduje používateľské meno a heslo, príkaz bude vyzerať takto:

$ wget --ftp-user=dan --ftp-password=********* FTP-URL

9. Vytvorte lokálnu kópiu webovej stránky

Ak si chcete stiahnuť obsah celej webovej stránky, môžete to urobiť pomocou voľby --mirror:

$ wget --mirror -p --convert-links -P /home/dan xyz.com
dávaj pozor na Extra možnosti príkazový riadok:

  • -p: stiahne všetky potrebné súbory správne zobrazenie HTML stránky.
  • --convert-links: odkazy v dokumentoch budú pre účely prevedené miestny pohľad stránky.
  • -P /home/dan : Materiály sa uložia do priečinka /home/dan.

10. Sťahovanie iba súborov určitého typu zo stránky

Ak chcete zo stránky stiahnuť iba súbory určitého typu, môžete použiť voľby -r -A:

$ wget -r -A.txt Website_url

11. Preskočte určité typy súborov

Ak chcete skopírovať celú webovú stránku, ale nepotrebujete súbory určitého typu, môžete ich sťahovanie zakázať voľbou --reject:

$ wget --reject=png Webová_adresa_url

12. Stiahnite si pomocou vlastného súboru .log

Ak chcete nahrať súbor a použiť svoj vlastný súbor .log, použite možnosť -o a zadajte názov súboru denníka:

$ wget -o wgetfile.log https://downloads.sourceforge.net/project/nagios/nagios-4.x/nagios-4.3.1/nagios-4.3.1.tar.gz?r=&ts=1489637334&use_mirror=excellmedia

Výsledky

wget - pomerne jednoduché použitie, ale celkom užitočné Linuxový nástroj. A v skutočnosti to, o čom sme hovorili, je len malá časť toho, čo dokáže. Dúfame, že táto recenzia pomôže tým, ktorí nie sú oboznámení s wget, aby ocenili tento program a možno ho zaradili do svojho každodenného arzenálu nástrojov príkazového riadku.

Vážení čitatelia! Používate nástroje príkazového riadku? linuxové reťazce nahrať súbory? Ak áno, povedzte nám o nich.

JavaScript je vo vašom prehliadači zablokovaný. Povoľte JavaScript pre túto stránku!

WGet je program na sťahovanie súborov a
stiahnuť celú stránku.

Bezplatná utilita Wget, ktorá pochádza zo sveta Linuxu, vám umožňuje stiahnuť si oboje jednotlivé súbory z internetu, ako aj celých stránok, pomocou odkazov na webových stránkach.

Ak potrebujete pomoc s možnosťami WGet, napíšte man wget v systéme Linux alebo wget.exe --help v systéme Windows.

Povedzme, že chceme tvoriť úplná kópia stránku www.site.com na vašom disku. Ak to chcete urobiť, otvorte príkazový riadok (Wget je nástroj konzoly) a napíšte nasledujúci príkaz:

Wget.exe -r -l10 -k -p -E -nc http://www.site.com WGET bude rekurzívne (parameter -r) prechádzať adresáre a podadresáre na vzdialenom serveri vrátane štýlov css (-k) s maximálnou rekurziou hĺbku rovnajúcu sa desiatim (-l), a potom nahraďte absolútne odkazy v stiahnutých dokumentoch HTML relatívnymi (-k) a rozšírenia za html (-E) pre neskoršie lokálne prezeranie stiahnutej lokality. Pri opätovnom sťahovaní nebudú žiadne tváre a prehratia sa prepíšu (-nc). Bohužiaľ interné štýly a obrázky špecifikované v štýloch sa neprevezmú

Ak máte v úmysle sťahovať z lokality ľubovoľný adresár (so všetkými priečinkami v ňom vnorenými), potom by bolo logickejšie zahrnúť parameter -np do príkazového riadka. Obslužnému programu to zabráni vo vzostupnej hierarchii adresárov nad určeným adresárom pri vyhľadávaní súborov:

Wget.exe -r -l10 -k http://www.site.com -np

Wget.exe -r -l10 -k http://www.site.com -c

V predvolenom nastavení sa všetko stiahnuté ukladá do pracovného adresára pomôcky. Možnosť -P vám pomôže určiť iné umiestnenie skopírovaných súborov:

Wget.exe -r -l10 -k http://www.site.com -P c:\internet\files

Nakoniec, ak nastavenia siete vaša sieť zahŕňa použitie proxy servera, jeho nastavenia musia byť oznámené programu. Cm.

Wget -m -k -nv -np -p --user-agent="Mozilla/5.0 (kompatibilné; Konqueror/3.0.0/10; Linux)" SITE_ADDRESS

Wget -i SÚBOR

Stiahnite si súbor do zadaný adresár(-P):

Wget -P /cesta/pre/uložiť ftp://ftp.example.org/nejaký_súbor.iso

Používanie používateľského mena a hesla na FTP/HTTP (možnosť 1):

Wget ftp://login: [e-mail chránený]/nejaký_súbor.iso

Použitie používateľského mena a hesla na FTP/HTTP (možnosť 2):

Wget --user=login --password=password ftp://ftp.example.org/some_file.iso

Stiahnuť v pozadie(-b):

Wget -b ftp://ftp.example.org/some_file.iso

Pokračovať (-c pokračovať) v sťahovaní predtým neúplne stiahnutého súboru:

Wget -c http://example.org/file.iso

Stiahnite si stránku s hĺbkou 10 a zapíšte denník do súboru denníka:

Wget -r -l 10 http://example.org/ -o log

Stiahnite si obsah adresára http://example.org/~luzer/my-archive/ a všetky jeho podadresáre bez toho, aby ste museli ísť hore v hierarchii adresárov:

Wget -r --no-parent http://example.org/~luzer/my-archive/

Ak chcete previesť odkazy na všetkých stiahnutých stránkach na relatívne pre lokálne prezeranie, musíte použiť prepínač -k:

Wget -r -l 10 -k http://example.org/

Podporovaná je aj identifikácia na serveri:

wget --save-cookies cookies.txt --post-data "user=foo&password=bar" http://example.org/auth.php

Kopírovať celú stránku:

Wget -r -l0 -k http://example.org/

Nepreberajte napríklad archívy zip:

Wget -r -R "*.zip" http://freeware.ru

Prihláste sa a stiahnite si súbor kľúča

@echo off wget --save-cookies cookies.txt --post-data "login=VAŠE PRIHLÁSENIE&heslo=VAŠE HESLO" http://beta.drweb.com/files/ -O- wget --load-cookies cookies.txt "http ://beta.drweb.com/files/?p=win%%2Fdrweb32-betating.key&t=f" -O drweb32-betating.key

Pozor! Register parametrov WGet je iný!

Základné spúšťacie klávesy

-V
--verzia
Zobrazuje verziu Wget.

-h
--Pomoc
Zobrazí pomoc s popisom všetkých možností príkazového riadka Wget.

-b
--pozadie
Prepnutie na pozadie ihneď po spustení. Ak nie je zadaný žiadny výstupný súbor -o, výstup je presmerovaný na wget-log.

-e príkaz
--vykonať príkaz
Vykonajte príkaz, ako keby bol súčasťou súboru . Príkaz spustený týmto spôsobom sa vykoná po príkazoch v súbore .wgetrc a má pred nimi prednosť. Ak chcete zadať viac ako jeden príkaz wgetrc, použite viacero prepínačov -e.

Protokolovanie a kľúče vstupného súboru

-o logfile
--output-file=súbor denníka
Zapíšte všetky správy do súboru denníka. Správy sa zvyčajne vydávajú v štandardnej chybe.

- súbor denníka
--append-output=súbor denníka
Pripojiť k súboru denníka. Rovnako ako -o, iba súbor denníka nie je prepísaný, ale pripojený. Ak protokolový súbor neexistuje, vytvorí sa nový súbor.

-d
--ladenie
Umožňuje výstup informácií o ladení, t.j. rôzne informácie, užitočné pre vývojárov Wget v prípade nesprávnej práce. Správca systému sa mohol rozhodnúť zostaviť Wget bez podpory ladenia, v takom prípade -d nebude fungovať. Pamätajte, že zostava s povoleným ladením je vždy bezpečná - Wget nevypíše informácie o ladení, pokiaľ to nie je výslovne požadované pomocou -d.

-q
--tichý
Vypne výstup Wget.

-v
--verbózny
Zahŕňa podrobný výstup zo všetkých možné informácie. Predvolene nastavené.

-nv
--neúplné
Podrobný výstup - vypne výrečnosť, ale vôbec sa nezastaví (na to použite -q), zobrazia sa chybové hlásenia a základné informácie.

-i súbor
--input-file=súbor
Prečítajte si URL zo súboru vstupného súboru, v takom prípade URL nemusí byť zadané na príkazovom riadku. Ak sú adresy URL zadané v príkazovom riadku a vo vstupnom súbore, najskôr sa vyžiadajú adresy URL z príkazového riadka. Súbor by nemal (ale môže) byť HTML dokument- postačuje konzistentný zoznam adries URL. Ak však zadáte --force-html, vstupný súbor sa bude považovať za html. V tomto prípade môžu nastať problémy s relatívnymi odkazmi, ktoré je možné vyriešiť zadaním vo vstupnom súbore alebo --base=url na príkazovom riadku.

-F
--force-html
Pri čítaní zoznamu adries zo súboru nastavte formát súboru na HTML. To umožňuje sťahovanie prostredníctvom relatívnych odkazov v lokálnom súbore HTML zadaním vo vstupnom súbore alebo --base=url na príkazovom riadku.

-B URL
--base=URL
Používa sa v spojení s -F na pridanie adresy URL na začiatok relatívne odkazy vo vstupnom súbore zadanom ako -i.

Stiahnuť kľúče

--bind-address=ADRESA
Keď otvárate klientske pripojenia TCP/IP, bind() na ADDRESS lokálneho počítača. ADRESA môže byť vo forme názvu hostiteľa alebo adresy IP. Tento kľúč môže byť užitočný, ak bolo zariadeniu priradených viacero adries IP.

-t číslo
--tries=číslo
Nastaví počet pokusov na číslo. Zadanie zhody 0 alebo inf nekonečné číslo pokusov. Predvolená hodnota je 20, okrem kritické chyby ako napríklad „pripojenie odmietnuté“ alebo „súbor sa nenašiel“ (404), pri ktorých sa pokusy neobnovia.

-O súbor
--output-document=súbor
Dokumenty sa neukladajú do príslušných súborov, ale sú zreťazené do súboru s názvom súbor. Ak súbor už existuje, bude prepísaný. Ak je súbor nastavený na -, dokumenty sa vytlačia na štandardný výstup (prepisuje sa -k). Všimnite si, že kombinácia s -k je normálne definovaná len na stiahnutie jedného dokumentu.

-nc
--no-clobber
Ak je súbor stiahnutý viac ako raz do rovnakého adresára, potom správanie Wget je určené niekoľkými voľbami, vrátane -nc. V niektorých prípadoch lokálny súbor budú prepísané alebo prepísané pri opätovnom sťahovaní, v iných - uložené.
Keď spustíte Wget bez -N, -nc alebo -r, stiahnutie toho istého súboru do rovnakého adresára spôsobí, že sa zachová pôvodná kópia súboru a nová kópia sa zapisuje s názvom súbor.1. Ak sa súbor stiahne znova, tretia kópia bude mať názov file.2 atď. Ak je zadaný prepínač -nc, toto správanie je potlačené, Wget odmietne stiahnuť nové kópie súboru. Takže „no-clobber“ je nesprávne pomenovanie tento režim- Zabráni sa nie prepisovaniu súborov (digitálne prípony už zabránili prepísaniu), ale vytváraniu viacerých kópií.
Pri spustení Wget s voľbou -r, ale bez -N alebo -nc, opätovné stiahnutie súboru prepíše starý. Pridanie -nc zabráni tomuto správaniu tým, že ponechá pôvodné verzie súbory a ignorovanie všetkých nových verzií na serveri.
Pri spustení Wget s prepínačom -N, s alebo bez -r, rozhodnutie stiahnuť novú verziu súboru závisí od miestnych a vzdialených časových pečiatok a veľkosti súboru. -nc nemožno zadať pomocou -N.
Ak zadáte -nc, načítajú sa súbory s príponami .html a .htm lokálny disk a zaobchádza sa s nimi, ako keby boli stiahnuté zo siete.

-c
--ďalej
Pokračujte v sťahovaní čiastočne stiahnutého súboru. Je to užitočné, keď potrebujete ukončiť sťahovanie spustené iným procesom Wget alebo iným programom. Napríklad:

Wget -c ftp://site/ls-lR.Z

Ak sa v aktuálnom adresári nachádza súbor ls-lR.Z, Wget ho bude považovať za prvú časť vzdialeného súboru a požiada server, aby pokračoval v sťahovaní s odsadením od začiatku, ktoré sa rovná dĺžke lokálneho súboru.

Nie je potrebné špecifikovať tento prepínač, aby aktuálny proces Wget pokračoval v sťahovaní, ak sa spojenie stratí v polovici. Toto je pôvodné správanie. -c ovplyvňuje iba sťahovanie, ktoré začalo pred aktuálnym procesom Wget, ak už existujú lokálne súbory.

Bez -c predchádzajúci príklad uloží odstránený súbor do ls-lR.Z.1, pričom ls-lR.Z zostane nezmenený.

Počnúc Wget 1.7, pri použití -c s neprázdnym súborom, Wget odmietne začať sťahovanie od začiatku, ak server nepodporuje sťahovanie. to by malo za následok stratu stiahnutých údajov. Ak chcete reštartovať sťahovanie, odstráňte súbor.

Tiež od Wget 1.7 pri použití -c na súbor rovnakú dĺžku súbor na serveri, Wget odmietne stiahnuť a zobrazí vysvetľujúcu správu. To isté sa stane, ak je vzdialený súbor menší ako lokálny (možno bol zmenený na serveri od predchádzajúceho pokusu) - pretože. "pokračovanie" v tomto prípade nemá význam, sťahovanie sa nevykoná.

Na druhej strane, pri použití -c sa lokálny súbor bude považovať za nedostatočne stiahnutý, ak je dĺžka vzdialeného súboru väčšia ako dĺžka lokálneho súboru. V tomto prípade sa bajty (dĺžka (vzdialené) - dĺžka (lokálne)) stiahnu a prilepia na koniec lokálneho súboru. V niektorých prípadoch je to očakávané správanie: napríklad môžete použiť -c na stiahnutie novej časti zhromaždených údajov alebo súboru denníka.

Ak však bol súbor na serveri upravený a nie iba pridaný, dostanete poškodený súbor. Wget nemá žiadne mechanizmy na kontrolu, či lokálny súbor je začiatkom vzdialeného súboru. Buďte obzvlášť opatrní pri použití -c s -r, ako každý súbor sa bude považovať za nedostatočne stiahnutý.

Poškodený súbor je možné získať aj pri použití -c s pokriveným HTTP proxy, ktorý pridá riadok „sťahovanie prerušené“. V budúcich verziách je možné pridať kľúč „rollback“ na opravu takýchto prípadov.

Prepínač -c možno použiť iba so servermi FTP a HTTP, ktoré podporujú hlavičku Range.

--pokrok=typ
Výber typu indikátora priebehu. Možné hodnoty sú „dot“ a „bar“.
Štandardne sa používa indikátor typu „bar“. Zobrazuje ASCII lištu priebehu sťahovania (tzv. "teplomer"). Ak výstup nie je v TTY, potom je predvolený typ indikátora "bodka".
Ak chcete prepnúť do režimu „bodka“, zadajte --progress=bodka. Priebeh sťahovania sa sleduje a zobrazuje ako bodky, kde každá bodka predstavuje pevná veľkosť stiahnuté dáta.
Pomocou bodového vstrekovania môžete zmeniť štýl výstupu zadaním dot:style. Definujú rôzne štýly iný význam za jeden bod. Štandardne jedna bodka predstavuje 1 000, 10 bodov tvorí zhluk, 50 bodov na riadok. Binárny štýl je viac „počítačový“ – 8K na bod, 16 bodov na klaster a 48 bodov na riadok (384K na riadok). Mega štýl je najvhodnejší na sťahovanie veľmi veľké súbory- každý bod zodpovedá 64K, 8 bodov na klaster a 48 bodov na riadok (riadok zodpovedá 3M).
Predvolený štýl je možné nastaviť cez .wgetrc. Toto nastavenie je možné prepísať na príkazovom riadku. Výnimkou je, že "bodka" má prednosť pred "čiarou", ak výstup nie je v TTY. Ak chcete vždy použiť bar, zadajte --progress=bar:force.

-N
--časová pečiatka
Umožňuje používanie časových pečiatok.

-S
--server-response
Zobrazte hlavičky HTTP servera a odpovede FTP servera.

--pavúk
Pri spustení s týmto kľúčom sa Wget správa ako sieťový pavúk, stránky nesťahuje, ale iba kontroluje. Napríklad pomocou Wget môžete skontrolovať záložky:

Wget --spider --force-html -i bookmarks.html

Táto funkcia vyžaduje veľa práce, aby Wget dosiahol funkčnosť skutočných webových pavúkov.

-T sekúnd
--timeout=sekundy
Nastaví časový limit siete na sekundy sekúnd. Ekvivalent k špecifikácii --dns-timeout, --connect-timeout a --read-timeout v rovnakom čase.
Keď sa Wget pripojí alebo číta z vzdialený hostiteľ, skontroluje časový limit a preruší operáciu, keď uplynie. Tým sa zabráni anomáliám, ako sú zaseknuté čítania alebo nekonečné pokusy o pripojenie. Jediný predvolený časový limit je časový limit čítania 900 sekúnd. Nastavenie časového limitu na 0 zruší kontroly.
Ak presne neviete, čo robíte, je najlepšie nenastavovať žiadne hodnoty pre kľúče časového limitu.

--dns-timeout=sekundy
Nastaví časový limit pre DNS dotazy v sekundách sekúnd. DNS dotazy, ktoré nie sú dokončené v určenom čase, zlyhajú. V predvolenom nastavení nie je nastavený žiadny časový limit pre dotazy DNS, okrem hodnôt definovaných systémovými knižnicami.

--connect-timeout=sekundy
Nastaví časový limit pripojenia na sekundy sekúnd. TCP spojenia ktorých inštalácia trvá dlhšie, budú zrušené. V predvolenom nastavení nie je nastavený žiadny časový limit pripojenia, okrem hodnôt definovaných systémovými knižnicami.

--read-timeout=sekundy
Nastaví časový limit čítania (a zápisu) na sekundy sekúnd. Čítanie, ktoré si vyžaduje viac času, bude neúspešné. Predvolená hodnota je 900 sekúnd.

--limit-rate=suma
Nastaví limit rýchlosti sťahovania na množstvo bajtov za sekundu. Hodnota môže byť vyjadrená v bajtoch, kilobajtoch s príponou k alebo megabajtoch s príponou m. Napríklad --limit-rate=20k nastaví limit rýchlosti sťahovania na 20KB/s. Toto obmedzenie je užitočné, ak z akéhokoľvek dôvodu nechcete, aby Wget využíval celú dostupnú šírku pásma. Wget implementuje limit prostredníctvom režimu spánku požadovaný čas po prečítaní siete, ktoré trvalo kratšie ako limit. Výsledkom je, že takáto stratégia vedie k spomaleniu prenosovej rýchlosti TCP približne na určený limit. Vyváženie si však vyžaduje určitý čas, takže sa nečudujte, že limit pre malé súbory nefunguje dobre.

-w sekúnd
--wait=sekundy
Medzi stiahnutiami počkajte určený počet sekúnd sekúnd. Použitie tejto funkcie sa odporúča na zníženie zaťaženia servera znížením frekvencie požiadaviek. Namiesto sekúnd je možné čas zadať v minútach s príponou m, v hodinách s príponou h alebo v dňoch s príponou d.
indikáciou veľký význam užitočné, ak je cieľová sieť alebo hostiteľ nedostupný, takže Wget počká dostatok času na odstránenie problémov so sieťou, než to skúsite znova.

--waitretry=sekundy
Ak nechcete, aby Wget čakal medzi rôznymi sťahovaniami, ale iba medzi pokusmi o prerušené sťahovanie, môžete použiť tento prepínač. Wget sa lineárne pozastaví, čaká 1 sekundu po prvom zlyhaní daného súboru, 2 sekundy po druhom zlyhaní atď. maximálna hodnota sekúnd. Takže hodnota 10 spôsobí, že Wget bude čakať až (1 + 2 + ... + 10) = 55 sekúnd na súbor. Tento prepínač je štandardne povolený v globálnom wgetrc.

--náhodne-čakaj
Niektoré webové stránky môžu analyzovať protokoly na identifikáciu sťahovačov, ako je napríklad Wget, sledovaním štatistických podobností medzi požiadavkami. Daný kľúč nastavuje náhodné pauzy v rozsahu od 0 do 2 * čakacích sekúnd, kde hodnotu čakania určuje prepínač --wait. To umožňuje, aby bol Wget vylúčený z takejto analýzy. V nedávnom článku o vývoji populárnych používateľských platforiem bol uvedený kód, ktorý umožňuje vykonávať takúto analýzu za behu. Autor navrhol blokovanie podsietí triedy C na blokovanie programov automatického sťahovania napriek možnej zmene adresy pridelenej DHCP. Vytvorenie kľúča --random-wait bolo inšpirované týmto chorým odporúčaním na zablokovanie mnohých nevinných používateľov kvôli chybe jedného.

-Y zapnutie/vypnutie
--proxy=zapnuté/vypnuté
Povolí alebo zakáže podporu servera proxy. Ak je nastavená vhodná premenná prostredia, podpora servera proxy je predvolene povolená.

-Q kvóta
--kvóta=kvóta
Nastaví kvótu pre automatické sťahovanie. Hodnota je špecifikovaná v bajtoch (predvolené), kilobajtoch (s príponou k) alebo megabajtoch (s príponou m). Kvóta neovplyvňuje sťahovanie jedného súboru ..gz, stiahne sa celý súbor ls-lR.gz. To isté sa stane pri zadávaní viacerých adries URL na príkazovom riadku. Kvóta je dôležitá pri rekurzívnom sťahovaní alebo pri zadávaní adries vo vstupnom súbore. To. môžete bezpečne zadať stránky wget -Q2m -i - sťahovanie sa preruší po dosiahnutí kvóty. Nastavenie hodnôt na 0 alebo inf prepíše obmedzenia.

dns-cache=off
Zakáže ukladanie dotazov DNS do vyrovnávacej pamäte. Wget si zvyčajne pamätá adresy, ktoré hľadá v DNS, takže sa nemusíte stále pýtať DNS server približne rovnaký (zvyčajne malý) súbor adries. Táto vyrovnávacia pamäť existuje iba v pamäti. Nový proces Wget znova požiada o DNS. V niektorých prípadoch však ukladanie adries do vyrovnávacej pamäte nie je žiaduce, a to ani pri krátkodobom používaní aplikácie, akou je Wget. Napríklad niektoré servery HTTP majú dynamicky pridelené adresy IP, ktoré sa z času na čas menia. ich DNS záznamy aktualizované pri každej zmene. Ak sťahovanie Wget z takéhoto hostiteľa zlyhá v dôsledku zmeny adresy IP, Wget zopakuje sťahovanie, ale (kvôli ukladaniu do vyrovnávacej pamäte DNS) sa pokúsi pripojiť k starej adrese. Keď je ukladanie DNS do vyrovnávacej pamäte vypnuté, Wget vykoná vyhľadávanie DNS pri každom pripojení, a tak zakaždým získa správnu dynamickú adresu. Ak nerozumiete vyššie uvedenému popisu, s najväčšou pravdepodobnosťou tento kľúč nebudete potrebovať.

--restrict-file-names=režim
Nastavuje, ktoré znakové sady možno použiť pri generovaní lokálneho súboru zo vzdialenej adresy URL. Znaky zakázané týmto kľúčom sú escapované, t.j. sú nahradené %HH, kde HH je hexadecimálny kód zodpovedajúceho znaku. V predvolenom nastavení Wget escapuje znaky, ktoré by neboli súčasťou názvu súboru vo vašom operačnom systéme, ako aj riadiace znaky, ktoré sa zvyčajne nedajú vytlačiť. Tento prepínač je užitočný na zmenu predvoleného nastavenia, ak ukladáte súbor na nenatívnu oblasť alebo chcete zakázať úniky riadiacich znakov. Keď je režim nastavený na "unix", Wget opustí znak / a riadiace znaky v rozsahu 0-31 a 128-159. Toto je predvolené nastavenie pre OS typu Unix. Keď je režim nastavený na "windows", Wget zakóduje znaky \, |, /, :, ?, ", * a riadiace znaky v rozsahu 0-31 a 128-159. Okrem toho Wget v režime Windows namiesto toho používa + of: na oddelenie hostiteľa a portu miestne názvy súbory a @ namiesto ? na oddelenie dotazovanej časti názvu súboru od zvyšku. Adresa URL je teda uložená v režime Unix ako www..pl?input=blah in Režim Windows sa uloží ako [e-mail chránený]= bla. Tento režim je predvolený v systéme Windows. Ak je režim pripojený k nocontrol, ako napríklad unix,nocontrol, escapovanie riadiacich znakov je vypnuté. Môžete použiť --restrict-file-names=nocontrol na vypnutie escapovania riadiacich znakov bez ovplyvnenia voľby režimu escapovania riadiacich znakov špecifického pre OS.

Kľúče adresára

-nd
--žiadne-adresáre
Pri rekurzívnom sťahovaní nevytvárajte adresárovú štruktúru. Pomocou tohto prepínača sa všetky súbory uložia do aktuálneho adresára bez prepísania (ak sa názov vyskytuje viackrát, názvy dostanú príponu .n).

-X
--force-directory
Reverse -nd - vytvorí adresárovú štruktúru, aj keď by inak nebola vytvorená. .txt uloží súbor do site/robots.txt.

-nH
--no-host-directory
Zakáže vytváranie hostiteľského adresára ..ru/. Tento kľúč prepíše toto správanie.

--protokolové-adresáre
Použite názov protokolu ako súčasť adresára pre lokálne súbory. Napríklad s týmto prepínačom wget -r http://hostiteľ uloží do http/host/... namiesto host/....

--cut-dirs=číslo
Ignorujte úrovne vnorenia čísel v adresároch. to užitočný kľúč pre explicitnú správu adresárov na ukladanie rekurzívne stiahnutého obsahu. Pri sťahovaní pomocou -r lokálna kópia sa uloží na ftp.. Ak prepínač -nH dokáže odstrániť ftp.. Tu príde vhod --cut-dirs; spôsobí to, že Wget zatvára oči pred množstvom vzdialených podadresárov. Nižšie sú uvedené niektoré pracovné príklady --cut-dirs.

Žiadne možnosti -> ftp. -nH -> pub/xxx/ -nH --cut-dirs=1 -> xxx/ -nH --cut-dirs=2 -> . --cut-dirs=1 -> ftp.site/xxx/

Ak sa len chcete zbaviť adresárovej štruktúry, potom je možné tento prepínač nahradiť kombináciou -nd a -P. Na rozdiel od -nd však --cut-dirs nestráca podadresáre - napríklad s -nH --cut-dirs=1 bude podadresár beta/ zachovaný ako xxx/beta, ako sa očakávalo.

-P predpona
--directory-prefix=prefix
Nastaví koreňový adresár na predponu. Koreňový adresár je adresár, kde sa budú ukladať všetky súbory a podadresáre, t.j. v hornej časti prevzatého stromu. Predvolené. (aktuálny adresár).

HTTP kľúče

-E
--html rozšírenie
Tento kľúč pridá k názvu lokálneho súboru príponu .html, ak je prevzatá adresa URL typu application/xhtml+xml alebo text/html a jej koniec sa nezhoduje regulárny výraz\.?. Je to užitočné napríklad pri zrkadlení stránok, ktoré používajú stránky .asp, keď chcete, aby zrkadlo fungovalo na bežnom serveri Apache. Užitočné aj pri sťahovaní dynamicky generovaného obsahu. Adresa URL ako http://site.com/article.cgi?25 sa uloží ako article.cgi?25.html. Takto uložené stránky sa stiahnu a prepíšu pri každom ďalšom zrkadlení, pretože Wget nemôže mapovať lokálny súbor X.html na vzdialenú X URL (zatiaľ nevie, že URL vracia odpoveď text/html alebo application/xhtml+xml). Ak chcete zabrániť opätovnému sťahovaniu, použite prepínače -k a -K, aby sa pôvodná verzia uložila ako X.orig.

--http-user=user
--http-passwd=heslo
Určuje používateľské meno používateľa a heslo heslo pristúpiť HTTP server. V závislosti od typu požiadavky ich Wget zakóduje pomocou normálnej (nezabezpečenej) alebo digestovej autorizačnej schémy. Ďalším spôsobom, ako zadať používateľské meno a heslo, je samotná adresa URL. V každom prípade odhalí vaše heslo každému, kto používa ps. Aby ste predišli odhaleniu hesiel, uložte ich do súborov .wgetrc alebo .netrc a uistite sa, že tieto súbory nie sú čitateľné inými používateľmi pomocou chmod. Zvlášť dôležité heslá sa neodporúčajú ukladať ani do týchto súborov. Zapíšte si heslá do súborov a potom ich ihneď po spustení Wget vymažte.

--no-cache
Zakáže ukladanie do vyrovnávacej pamäte na strane servera. V tejto situácii Wget posiela vzdialený server zodpovedajúcu direktívu (Pragma: no-cache), aby ste získali aktualizovanú verziu súboru, nie verziu uloženú vo vyrovnávacej pamäti. Toto je obzvlášť užitočné pri vymazávaní zastaraných dokumentov na proxy serveroch. Ukladanie do vyrovnávacej pamäte je predvolene povolené.

--žiadne cookies
Zakáže používanie súborov cookie. Cookies sú mechanizmus na udržiavanie stavu servera. Server odošle cookie klientovi pomocou hlavičky Set-Cookie, klient zahrnie tento cookie do všetkých nasledujúcich požiadaviek. Pretože Cookies umožňujú vlastníkom serverov sledovať návštevníkov a zdieľať tieto informácie medzi stránkami, niektorí ich považujú za porušenie súkromia. Štandardne sa používajú súbory cookie; súbory cookie sa však predvolene neukladajú.

--load-cookies súbor
Načítavanie súborov cookie zo súboru pred prvou požiadavkou HTTP. súbor- textový súbor vo formáte, ktorý sa pôvodne používal cookie s.txt Netscape. Táto možnosť sa zvyčajne vyžaduje pri zrkadlení stránok, ktoré vyžadujú autorizáciu pre časť alebo celý obsah. Autorizácia sa zvyčajne vykonáva vydaním súboru cookie HTTP serverom po prijatí a overení registračných informácií. V budúcnosti prehliadač odošle súbor cookie pri prezeraní tejto časti stránky a poskytuje identifikáciu. Zrkadlenie takejto stránky vyžaduje, aby Wget poskytoval rovnaké súbory cookie ako prehliadač. To je dosiahnuté pomocou --load-cookies - stačí nasmerovať Wget na umiestnenie vášho cookies.txt a ten odošle cookies identické s prehliadačom. Rôzne prehliadače ukladajú súbory cookie na rôznych miestach: Netscape 4.x. ~/.netscape/cookies.txt. Mozilla a Netscape 6.x. Súbor cookie Mozilla sa tiež nazýva cookies.txt a nachádza sa niekde vnútri ~/.mozilla v adresári vášho profilu. Úplná cesta zvyčajne vyzerá ako ~/.mozilla/default/some-weird-string/cookies.txt. internet Explorer. Súbor cookie pre Wget je možné získať prostredníctvom ponuky Súbor, Import a export, Export súborov cookie. Testované v programe Internet Explorer 5; pracovať s viacerými skoré verzie nie je zaručené. iné prehliadače. Ak používate iný prehliadač, --load-cookies bude fungovať len vtedy, ak sa formát súboru zhoduje s formátom Netscape, t.j. čo Wget očakáva. Ak nemôžete použiť --load-cookies, môže existovať iná alternatíva. Ak má váš prehliadač „správcu súborov cookie“, môžete zobraziť súbory cookie potrebné na zrkadlenie. Zapíšte si názov a hodnotu súboru cookie a manuálne ich nasmerujte na Wget, pričom obídete „oficiálnu“ podporu:

Wget --cookies=off --header "Cookie: názov=hodnota"

--save-cookies súbor
Uloženie cookies do súboru pred ukončením. Táto možnosť neukladá súbory cookie s ukončenou platnosťou a súbory cookie bez konkrétneho času platnosti (tzv. „cookies relácie“). Pozri tiež --keep-session-cookies.

--keep-session-cookies
--save-cookies ukladá súbory cookie relácie. Súbory cookie relácie sa zvyčajne neukladajú, pretože sú určené na zabudnutie po zatvorení prehliadača. Ich uloženie je užitočné pre stránky, ktoré vyžadujú autorizáciu na prístup k stránkam. Pri použití tejto možnosti rôzne procesy Wget pre stránku sa zobrazí ako jeden prehliadač. Pretože zvyčajne formát súboru cookie neobsahuje súbory cookie relácie, Wget ich označí časovou pečiatkou 0. --load-cookies s nimi zaobchádza ako so súbormi cookie relácie, čo však môže spôsobiť problémy iným prehliadačom. Takto načítané súbory cookie sa interpretujú ako relácia cookies, to znamená, že aby sa uložili pomocou --save-cookies, musíte znova zadať --keep-session-cookies.

--ignore-length
Bohužiaľ, niektoré servery HTTP (presnejšie programy CGI) odosielajú nesprávnu hlavičku Content-Length, čo privádza Wget k šialenstvu, pretože myslí si, že dokument nebol stiahnutý úplne. Tento syndróm si môžete všimnúť, ak sa Wget pokúša sťahovať rovnaký dokument znova a znova, pričom zakaždým indikuje prerušenie spojenia na rovnakom byte. S týmto prepínačom Wget ignoruje hlavičku Content-Length, ako keby nikdy neexistovala.

--header=ďalšia-hlavička
Zadajte ďalšiu hlavičku pre HTTP prenosy server. Hlavičky musia obsahovať „:“ po jednom alebo viacerých neprázdnych znakoch a nesmú obsahovať nové riadky. Viacnásobným použitím voľby --header môžete zadať viacero ďalších hlavičiek.

Wget --header="Accept-Charset: iso-8859-2" --header="Accept-Language: hr" http://aaa.hr/

Určenie ako nadpis prázdny reťazec vymaže všetky predtým zadané vlastné hlavičky.

--proxy-user=používateľ
--proxy-passwd=heslo
Určuje používateľské meno používateľa a heslo heslo na autorizáciu na serveri proxy. Wget ich zakóduje pomocou základnej autorizačnej schémy. Tu platia rovnaké bezpečnostné úvahy ako pre prepínač --http-passwd.

--referer=url
V žiadosti obsahuje hlavičku „Referer: url.“ Užitočné, ak si server pri doručovaní dokumentu myslí, že hovorí s interaktívnym prehliadačom a skontroluje, či pole Referer obsahuje stránku smerujúcu na požadovaný dokument.

--uložiť hlavičky
Uloží hlavičky odpovedí HTTP do súboru tesne pred obsahom, pričom ako oddeľovač použije prázdny reťazec.

-U agent-reťazec
--user-agent=reťazec-agenta
Identifikovaný ako reťazec agenta prehliadača pre server HTTP. Protokol HTTP umožňuje identifikovať klientov pomocou poľa hlavičky User-Agent. To umožňuje rozlíšiť softvér, zvyčajne pre štatistiku alebo porušenie protokolu sledovania. Wget sa zvyčajne identifikuje ako Wget/verzia, kde je verzia Aktuálna verzia Wget. Niektoré stránky však majú politiku prispôsobenia výstupu prehliadača na základe poľa User-Agent. V zásade to nie je zlý nápad, ale niektoré servery odmietajú prístup iným klientom ako Mozilla a Microsoft Internet Explorer. Tento kľúč vám umožňuje zmeniť hodnotu User-Agent vráteného Wgetom. Používanie tohto prepínača sa neodporúča, pokiaľ si nie ste istí, čo robíte.

--post-data=string
--post-file=subor
Využitie metóda POST pre všetkých HTTP požiadavky a odošle uvedené údaje v požiadavke. --post-data odošle reťazec ako dáta a --post-file odošle obsah súboru súboru. Inak fungujú rovnako. Upozorňujeme, že Wget musí na začiatku poznať dĺžku požiadavky POST. Argument prepínača --post-file musí byť bežný súbor; zadanie FIFO ako /dev/stdin nebude fungovať. Nie je úplne jasné, ako sa dá toto obmedzenie v HTTP/1.0 obísť. Hoci HTTP/1.1 zavádza blokový prenos, ktorý nevyžaduje žiadne predchádzajúce znalosti o dĺžke, klient ho nemôže použiť, pokiaľ si nie je istý, že hovorí so serverom HTTP/1.1. A nemôže to vedieť, kým nedostane odpoveď, ktorá naopak príde na plnohodnotnú požiadavku. Problém s vajcami a kuracím mäsom. Poznámka: Ak Wget dostane presmerovanie ako odpoveď na POST žiadosť, nepošle údaje POST na adresu URL presmerovania. Často URL adresa ktoré spracovávajú POST, vydávajú presmerovanie na bežnú stránku (hoci je to technicky nepovolené), ktorá nechce akceptovať POST. Zatiaľ nie je jasné, či je toto správanie optimálne; ak to nebude fungovať, bude to zmenené. Príklad nižšie ukazuje, ako sa prihlásiť na server pomocou POST a potom stiahnuť požadované stránky, ktoré sú dostupné len pre oprávnených používateľov:

wget --save-cookies cookies..php wget --load-cookies cookies.txt -p http://server.com/interesting/article.php

Konfigurácia WGET

Je možné zadať základné nastavenia, ktoré je potrebné zakaždým zapísať konfiguračný súbor programy. Ak to chcete urobiť, prejdite do pracovného adresára Wget, nájdite tam súbor sample.wgetrc a premenujte ho na .wgetrc a editor, zapíšte si potrebné konfiguračné parametre.

User-agent = "Mozilla/5.0" Pokusy = 5 počet pokusov o sťahovanie počkajte = 0 nepozastavujte pokračovať = zapnuté musíte pokračovať v sťahovaní dir_prefix = ~/Downloads/ kam umiestniť stiahnuté súbory use_proxy=on - použite proxy http_proxy - vlastnosti vášho proxy servera.

  • Opýtať sa premenná prostredia WGETRC s úplnou cestou k súboru.
  • Nastavte premennú HOME, do ktorej chcete zadať cestu domovský priečinok používateľ (c:\Dokumenty a nastavenia\jonh). Potom wget vyhľadá súbor "wgetrc" v tomto priečinku.
  • Okrem toho môžete vytvárať súbor wget.ini v rovnakom priečinku ako wget.exe a tam nastavte ďalšie možnosti príkazového riadka wget.

Užitočné informácie o WGET nájdete tu:

  • PhantomJS – použite, ak potrebujete stiahnuť stránku, na ktorej sú niektoré údaje načítané pomocou JavaScriptu
.

Pri práci v konzole musíme pomerne často komunikovať so sieťou, napríklad sťahovať súbory alebo celé webové stránky. Ak webové stránky sťahujeme pomerne zriedka, potom je situácia so súbormi úplne iná. To môže byť rôzne skripty, inštalačné balíky, programy, kľúče, zoznamy balíkov a ďalšie. Súbor si môžete stiahnuť v konzole Linux pomocou pomôcky wget. Budeme to zvážiť v tomto článku.

Toto je veľmi výkonný nástroj, na ktorom môžete pracovať HTTP protokoly, HTTPS a FTP. Okrem toho je podporovaná práca cez proxy. Príkaz wget linux môže dokonca sťahovať súbory na pozadí - bez zásahu používateľa, na rozdiel od väčšiny webových prehliadačov.

Okrem sťahovania súborov je možné vďaka funkcii otvárania odkazov na stránkach ukladať webové stránky alebo aj celé weby. Táto funkcia sa tiež nazýva rekurzívne načítanie. To je všetko, čo v dnešnom článku zvážime, ale ako vždy začneme syntaxou a základnými možnosťami pomôcky.

Príkaz wget linux má veľmi jednoduchú syntax:

$ možnosti wget url_address

Môžete zadať viacero adries URL na stiahnutie, ale niekoľko naraz. Možnosti sú voliteľné, ale vo väčšine prípadov sa používajú na nastavenie možností zavádzania.

možnosti

Syntax voľby je veľmi voľná. Každá možnosť má zvyčajne dlhé aj a krátke meno. Môžu byť napísané pred URL aj za. Medzi možnosť a jej hodnotu nie je potrebné vkladať medzeru, môžete napríklad napísať -o log alebo -olog. Tieto hodnoty sú ekvivalentné. Taktiež, ak možnosti nemajú parametre, nie je potrebné každú začínať pomlčkou, môžete ich napísať všetky spolu: -drc a -d -r -c. Tieto možnosti wget sú tiež ekvivalentné.

Teraz prejdime na zoznam možností. wget má príliš veľa možností, pokryjeme len tie hlavné.

  • -V (--verzia)- zobraziť verziu programu
  • -h (--pomoc)- vydať osvedčenie
  • -b (--pozadie)- práca v pozadí
  • -o súbor (--out-file)- zadajte súbor denníka
  • -d (--debug)- povoliť režim ladenia
  • -v (--verbose)- zobraziť maximum informácií o prevádzke pomôcky
  • -q (--tichý)- zobrazovať minimum informácií o diele
  • -i súbor (--input-file)- čítať URL zo súboru
  • --force-html- prečítať súbor špecifikovaný v predchádzajúcom parametri ako html
  • -t (--skúsy)- počet pokusov o pripojenie k serveru
  • -O súbor (--output-document)- súbor, do ktorého sa budú ukladať prijaté dáta
  • -c (--pokračovať)- pokračovať v predtým prerušenom sťahovaní
  • -S (--server-response)- zobraziť odpoveď servera
  • --pavúk- skontrolujte, či adresa URL funguje
  • -T čas (--timeout)- časový limit pripojenia k serveru
  • --limitná sadzba- obmedziť rýchlosť sťahovania
  • -w (--čakať)- interval medzi požiadavkami
  • -Q (--kvóta) - maximálna veľkosť K stiahnutiu
  • -4 (--inet4only)- použite protokol ipv4
  • -6 (--inet6only)- použite protokol ipv6
  • -U (--user-agent)- reťazec USER AGENT odoslaný na server
  • -r (-- rekurzívne) - rekurzívna operácia utility
  • -l (--level)- hĺbka pri rekurzívnom skenovaní
  • -k (--convert-links)- previesť odkazy na miestne pri načítavaní stránok
  • -P (--adresár-predpona)- adresár, do ktorého sa budú nahrávať súbory
  • -m (--zrkadlo)- stiahnuť stránku do lokálneho počítača
  • -p (--page-požiadavky)- počas načítania stránky si stiahnite všetky potrebné zdroje

Samozrejme, toto nie sú všetky kľúče wget, ale už je tu príliš veľa teórie, teraz prejdime k praxi. Príklady wget sú oveľa zaujímavejšie.

Používanie wget Linux

Príkaz wget linux je zvyčajne štandardne dodávaný na väčšine distribúcií, ale ak nie, dá sa nainštalovať veľmi jednoducho. Napríklad inštalácia pomocou yum by vyzerala takto:

yum -y nainštalovať wget

A na distribúciách založených na Debiane:

sudo apt install wget

Teraz prejdime na príklady:

Príkaz wget linux stiahne jeden súbor a uloží ho do aktuálneho adresára. Počas sťahovania uvidíme priebeh, veľkosť súboru, jeho dátum posledná zmena, ako aj rýchlosť sťahovania:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

2. Uložte súbor pod iným názvom

Voľba -O vám umožňuje zadať názov pre uložený súbor, napríklad stiahnuť súbor wget s názvom wget.zip:

wget -O wget.zip http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

3. Stiahnite si viacero súborov

Môžete si stiahnuť niekoľko súborov jedným príkazom, dokonca aj pomocou rôznych protokolov, jednoduchým zadaním ich URL:

wget http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz ftp://ftp.gnu.org/gnu/wget/wget-1.10.1.tar.gz.sig

4. Získajte URL zo súboru

wget -i /wget/tmp.txt

5. Pokračujte v sťahovaní

Pomôcka wget linux je navrhnutá tak, aby pracovala v pomalých a nestabilné siete. Preto, ak ste sťahovali veľký súbor a spojenie sa počas sťahovania stratilo, potom si môžete stiahnuť súbor wget pomocou voľby -c.

wget -c http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

Voľba -b spôsobí, že program beží na pozadí, všetok výstup sa zapíše do súboru protokolu, na konfiguráciu súboru protokolu sa používajú špeciálne voľby wget:

wget -b -o ~/wget.log http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

7. Obmedzte rýchlosť sťahovania

Príkaz wget linux vám umožňuje nielen pokračovať v sťahovaní súborov, ale aj obmedziť rýchlosť sťahovania. Na to existuje možnosť --limit-rate. Napríklad obmedzme rýchlosť na 100 kilobitov:

wget --limit-rate=100k ftp://ftp.iinet.net.au/debian/debian-cd/8.4.0/amd64/iso-dvd/debian-8.4.0-amd64-DVD-1.iso

Tu, rovnako ako v iných podobných príkazoch, sú k dispozícii indexy na označenie rýchlosti - k - kilobit, m - megabit, g - gigabit atď.

8. Pripojenie prihlasovacieho mena a hesla

Niektoré zdroje vyžadujú na stiahnutie súborov overenie. Pomocou volieb --http-user=username, --http-password=password a --ftp-user=username, --ftp-password=password môžete nastaviť užívateľské meno a heslo pre HTTP alebo FTP zdroje.

wget --http-user=narad --http-password=password http://mirrors.hns.net.in/centos/6.3/isos/x86_64/CentOS-6.3-x86_64-LiveDVD.iso

wget --ftp-user=narad --ftp-password=password ftp://ftp.iinet.net.au/debian/debian-cd/6.0.5/i386/iso-dvd/debian-6.0.5-i386 -DVD-1.iso

9. Stiahnite a spustite

Pravdepodobne ste už videli takéto príkazy. wget vám umožňuje okamžite spustiť stiahnuté skripty:

wget -O - http://site/script.sh | bash

Ak nie sú odovzdané žiadne argumenty voľbe -O, stiahnutý súbor sa vytlačí na štandardný výstup, potom ho môžeme presmerovať z bash tlmočníka, ako je uvedené vyššie.

10. Uložte súbor do priečinka

V predvolenom nastavení wget uloží súbor do aktuálneho priečinka, ale toto správanie sa dá ľahko zmeniť voľbou -P:

wget -P ~/Downloads/ http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz

11. Odovzdajte informácie o prehliadači

Niektoré stránky filtrujú roboty, ale môžeme odovzdať falošné informácie o našom prehliadači (user-agent) a stránke, z ktorej sme prišli (http-referer).

wget --refer=http://google.com --user-agent="Mozilla/5.0 Firefox/4.0.1" //webové stránky

12. Počet pokusov o stiahnutie

V predvolenom nastavení sa wget pokúša zopakovať sťahovanie 20-krát, kým zlyhá. Počet krát je možné zmeniť pomocou voľby --tries: