Fórum Ubuntu CZ/SK

Ubuntu pro osobní počítače => Software => Příkazový řádek a programování pro GNU/Linux => Téma založeno: psychogenius 21 Února 2012, 13:35:52

Název: Uprava html [vyřešeno]
Přispěvatel: psychogenius 21 Února 2012, 13:35:52
zdravim potreboval by som z html kodu odtranit vsetko co sa nachadza v <> vcetne tych zobacikov ale sed 's/<.*>//g'  sed "s/<.*>//g"  nefunguje neprejde to cez specialne znaky .
Název: Re:Uprava html
Přispěvatel: Šuohob 21 Února 2012, 13:38:46
pomohl by html2text? mel by byt v repozitarich
Název: Re:Uprava html
Přispěvatel: psychogenius 21 Února 2012, 15:17:17
Diky pomohlo len som musel trafit spravne kodovanie :D
Název: Re:Uprava html [vyřešeno]
Přispěvatel: Nemo7 24 Února 2012, 18:01:13
zdravim potreboval by som z html kodu odtranit vsetko co sa nachadza v <> vcetne tych zobacikov ale sed 's/<.*>//g'  sed "s/<.*>//g"  nefunguje neprejde to cez specialne znaky .
Jinak i ten zápis v sedu je nesmyslný, můžete vyzkoušet(nezobrazí se bbb) :
Kód: [Vybrat]

echo "BEG <a>bbbb</a>" | sed "s/<.*>//g"
Správně by mělo být
Kód: [Vybrat]

echo "BEG <a>bbbb</a>" | sed "s/<[^>]*>//g"
Regulární výrazy jsou totiž "rozežrané".  :D