Fórum Ubuntu CZ/SK
Ubuntu pro osobní počítače => Obecná podpora => Téma založeno: truhlik 16 Března 2008, 15:45:29
-
Zdravim vespolek,
mam na Vas dotaz zvlaste na ty co to umite pracovat s wget. Mame skolni projekt ve kterem tvorime databazi a rozhodli jsme se udelat databazi rozhleden. Podklady stahujem ze stranky [url]www.rozhlednyunas.cz[\url] bohuzel tam maji nejaky divny kodovani a nedari se nam ty stranky stahnout WGETem komplet v cestine. Nenapada vas nekoho jak by se to dalo vyresit? Diky
-
Ty stranky jsou v kodovani iso-8859-2, do utf8, chces-li, je musis prevest, napriklad programem cstocs.
Btw, nehranici takove pouziti obsahu (bez souhlasu autora) s plagiatorstvim?
-
Vzhledem k tomu, ze se jedna o vzdelavaci ucely, tak bych rekl, ze je to pravne v poradku.
Co se problemu s diakritikou tyce, tak ja se obavam, ze to maji zmrsene uz v html souborech, tedy neni to spatne nastavenym kodovanim, ani tim, ze by to bylo spatne stazene wgetem.
-
1) Ty stranky jsou volne k dispozici my jen zpracujem castecne informace a samozrejme uvedene zdroj nasich informaci.
2) Zkousel jsem ve firefoxu menit kodovani a ani u jednoho se mi korektne nezobrazila stranka. Asi jsou spatne napsany.
-
jo, mate pravdu.. nechapu jak, ale uplne jsem ty zmrsene znaky prehlidl :-) taky myslim, ze to maji zmrsene uz oni.
-
No oni to někde mají v pořádku (třeba tam, kde se nejedná o stránku o nějaké rozhledně), ale většinou ne. Upozornil bych webmastera, aby to reuploadoval, ale nějak se mi nepodařilo vypátrat jeho e-mailovou adresu, jen jeho věk, na který mu ale mail nepošlu.
-
;D Kazdopadne diky.