Po dlouhe dobe jsem zacal delat poradek ve stazenych dokumentech. Zjistil jsem ze mam stazenych cca 600 html stranek s ruznymi navody a tipy.
Po pro mazani jsem se dostal na cislo cca 400 a tady zacina muj problem. Stranky jsou ulozeny ve formatu (soubor, soubor.htm, soubor.html) + adresar (soubor_sobory, soubor_files).
Pri promazavani jsem vsak smazal jen html soubory a slozky zustaly na miste.
Premyslel jsem jak se techto prebytecnych slozek zbavit a nakonec jsem vyplodil tyto skripty:
rm -rf soubory
rm -rf adresare
for b in *; do echo $b | grep -v _soubory | grep -v _files >> soubory; done
for i in *_soubory; do echo "${i%_soubory}" >> adresare; done
for a in *_files; do echo "${a%_files}" >> adresare; done
Tim jsem ziskal dva seznamy "soubory" obsahujici html,htm a "adresare" obsahujici vsechny slozky. Nasledujici idea, pres kterou se nemohu dostat, bylo porovnat tyto seznamy a jejich rozdil tj. slozky ktere jsou navic predhodit rm-rf ke smazani.
Kamen urazu je prave to porovnani, ktere nemohu vyresit.
Cele je to komplikovane tim ze slozky maji koncovku _soubory i _files a soubory html, htm nebo zadnou
Dekuji za rady