Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Internet a sítě => Téma založeno: ja_ran 20 Ledna 2014, 16:35:11

Název: wget - stažený web je bez grafiky [vyřešeno]
Přispěvatel: ja_ran 20 Ledna 2014, 16:35:11
Zdravím,
chtěl jsem stáhnout kompletní web revo.byps.cz, protože autor oznámil ukončení stránek.
Kód: [Vybrat]
$ wget -mpkE  -P REVO http://revo.byps.cz
což by mělo vést ke kýženému výsledku, ale stránky se zobrazují se bez grafiky (bez css stylů?), pouze text, správně přeložené odkazy a obrázky.
Né že by se to nedalo přežít, ale ...
Manuál wget jsem četl a potřebné volby mám snad správně.
-m = celý web
-p = všechny potřebné soubory pro zobrazení stránky (včetně CSS)
-k = překlad odkazů
-E = uložení se správnou koncovkou
-P = stažení do adresáře

druhý pokus byl s přidáním volby
-nd = bez vytváření adresářů

ale výsledek stejný

Tušíte někdo v čem je problém?
Dík.
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: Marp 20 Ledna 2014, 17:32:32
A co tak zkusit
Kód: [Vybrat]
wget -r http://revo.byps.cz
S parametrem -r se stáhne totiž kompletní obsah webu.
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: RRRadek Neužil 20 Ledna 2014, 17:47:49
A také lze zkusit HTTrack který najdeš v repositářích Ubuntu. ;)

http://www.httrack.com/page/1/en/index.html
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: ja_ran 20 Ledna 2014, 20:01:16
To Mark:
parametr -r by měl být obsažený v parametru -m
viz. help k wget
Kód: [Vybrat]
-m,  --mirror             zkratka pro -N -r -l inf --no-remove-listing.

To RRadek Neužil:
HTTrack jsem zkoušel pod Win a výsledek bohužel stejný jako s wget pod Linuxem
jedinné co stáhlo web i s grafikou je Offline Explorer pod Win, jenže ve zkušební bezplatné verzi stáhne jen část (omezení počtu souborů) a kupovat plnou verzi kvůli jednomu webu určitě nebudu :(
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: ja_ran 21 Ledna 2014, 00:26:30
na fóru LinuxMintu mi poradili
Citace
Kód: [Vybrat]
wget -mpkE -e robots=off revo.byps.czwget pravděpodobně respektuje robots.txt a kam je jím zakázáno, tam nejde.
Bohužel než jsem to stihl vyzkoušet tak stránky jsou už nedostupné :(
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: GdH 21 Ledna 2014, 00:56:16
Kdybys chtěl dolovat v archivu, tak tohle by ti mohlo třeba pomoct:
http://wayback.archive.org/web/20130511215818/http://revo.byps.cz/index.php (http://wayback.archive.org/web/20130511215818/http://revo.byps.cz/index.php)
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: ja_ran 21 Ledna 2014, 21:51:34
to GdH:
Děkuji za odkaz na archiv - vůbec jsem netušil, že něco takového je.
Sice jde o starší archiv, ale dososám si z něj to co mi chybí. Ty novější články mám snad všechny.
Díky
Název: Re:wget - stažený web je bez grafiky
Přispěvatel: GdH 21 Ledna 2014, 22:25:05
to GdH:
Děkuji za odkaz na archiv - vůbec jsem netušil, že něco takového je.
Sice jde o starší archiv, ale dososám si z něj to co mi chybí. Ty novější články mám snad všechny.
Díky

Přinejmenším tam máš css :) Ani nevim, jestli jsem ti hodil poslední dostupnou, můžeš kouknout do kalendáře:
http://wayback.archive.org/web/*/revo.byps.cz (http://wayback.archive.org/web/*/revo.byps.cz)