Hoj chtel jsem si stahnout texty z webu jednoho serialu. Jelikoz je prave ta cast dynamicky generovana zvolil jsem hrubou silu a pomici wget-u jsem postahoval cca 200 kopii. Sedem jsem pak vypreparoval bloky textu o ktere ma zajem.
Potreboval bych sak odstranit duplicitni bloky a stim si nevim rady.
Kdyby nekdo mel (jak, ze asi ma nejake) elegantnejsi reseni, budu rad. Jedna se o sekci "Hlášky" na adrese
http://fringe.sff.cz/Soubor s daty prikladam.
Dekuji za pomoc.
[attachment deleted by admin]