Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Internet a sítě => Téma založeno: ja_ran 20 Ledna 2014, 16:35:11
-
Zdravím,
chtěl jsem stáhnout kompletní web revo.byps.cz, protože autor oznámil ukončení stránek.
$ wget -mpkE -P REVO http://revo.byps.cz
což by mělo vést ke kýženému výsledku, ale stránky se zobrazují se bez grafiky (bez css stylů?), pouze text, správně přeložené odkazy a obrázky.
Né že by se to nedalo přežít, ale ...
Manuál wget jsem četl a potřebné volby mám snad správně.
-m = celý web
-p = všechny potřebné soubory pro zobrazení stránky (včetně CSS)
-k = překlad odkazů
-E = uložení se správnou koncovkou
-P = stažení do adresáře
druhý pokus byl s přidáním volby
-nd = bez vytváření adresářů
ale výsledek stejný
Tušíte někdo v čem je problém?
Dík.
-
A co tak zkusit
wget -r http://revo.byps.cz
S parametrem -r se stáhne totiž kompletní obsah webu.
-
A také lze zkusit HTTrack který najdeš v repositářích Ubuntu. ;)
http://www.httrack.com/page/1/en/index.html
-
To Mark:
parametr -r by měl být obsažený v parametru -m
viz. help k wget
-m, --mirror zkratka pro -N -r -l inf --no-remove-listing.
To RRadek Neužil:
HTTrack jsem zkoušel pod Win a výsledek bohužel stejný jako s wget pod Linuxem
jedinné co stáhlo web i s grafikou je Offline Explorer pod Win, jenže ve zkušební bezplatné verzi stáhne jen část (omezení počtu souborů) a kupovat plnou verzi kvůli jednomu webu určitě nebudu :(
-
na fóru LinuxMintu mi poradili
wget -mpkE -e robots=off revo.byps.czwget pravděpodobně respektuje robots.txt a kam je jím zakázáno, tam nejde.
Bohužel než jsem to stihl vyzkoušet tak stránky jsou už nedostupné :(
-
Kdybys chtěl dolovat v archivu, tak tohle by ti mohlo třeba pomoct:
http://wayback.archive.org/web/20130511215818/http://revo.byps.cz/index.php (http://wayback.archive.org/web/20130511215818/http://revo.byps.cz/index.php)
-
to GdH:
Děkuji za odkaz na archiv - vůbec jsem netušil, že něco takového je.
Sice jde o starší archiv, ale dososám si z něj to co mi chybí. Ty novější články mám snad všechny.
Díky
-
to GdH:
Děkuji za odkaz na archiv - vůbec jsem netušil, že něco takového je.
Sice jde o starší archiv, ale dososám si z něj to co mi chybí. Ty novější články mám snad všechny.
Díky
Přinejmenším tam máš css :) Ani nevim, jestli jsem ti hodil poslední dostupnou, můžeš kouknout do kalendáře:
http://wayback.archive.org/web/*/revo.byps.cz (http://wayback.archive.org/web/*/revo.byps.cz)