Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: Jak najít duplicitní soubory?  (Přečteno 9738 krát)

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Jak najít duplicitní soubory?
« kdy: 28 Ledna 2013, 10:29:03 »
Přátelé,

potřebuji na externím disku s fotografiemi (cca 290 GB) vyhledat duplicitní soubory. Soubory se mohou lišit názvem, datem, příponou, ale mají shodný obsah. Je to vůbec amatérsky možné?

Představuji si výpis:

Citace
duplicity:
svatba-013.jpg
/zaloha/fotky/PIC005429.JPG
-
svatba-019.jpg
/zaloha/fotky/PIC005488.JPG
/zaloha/fotky/svatba/PIC005488.JPG
-

Díky.

Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6322
Re:Jak najít duplicitní soubory?
« Odpověď #1 kdy: 28 Ledna 2013, 10:40:40 »
Tohle jsem kdysi taky řešil a myslím, že pomocí Digikamu(duplicity umí) úspěšně vyřešil a uvolnil pár desítek až stovek megabajtů.
Jen počítej s tím, že je to časově náročné. Nejprve se totiž tvoří databáze "otisku palce".
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem.

Prosím označit text kódu v editoru # pro lepší formátování textu případného výpisu. Děkuji.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #2 kdy: 28 Ledna 2013, 10:43:52 »
Tohle jsem kdysi taky řešil a myslím, že pomocí Digikamu(duplicity umí) úspěšně vyřešil a uvolnil pár desítek až stovek megabajtů.
Jen počítej s tím, že je to časově náročné. Nejprve se totiž tvoří databáze "otisku palce".

Díky vyzkouším, času mám dost, klidně to může běžet celej víkend. Problém, je, že si bude asi digikam ukládat mraky dat...
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6322
Re:Jak najít duplicitní soubory?
« Odpověď #3 kdy: 28 Ledna 2013, 10:47:36 »
Otisk palce-40GB 13min 42s.
Vyhledání duplicit dle výkonu procesoru. U mě 40s.
« Poslední změna: 28 Ledna 2013, 11:00:42 od Roman "Rovano" Vacho »
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem.

Prosím označit text kódu v editoru # pro lepší formátování textu případného výpisu. Děkuji.

jmp

  • Host
Re:Jak najít duplicitní soubory?
« Odpověď #4 kdy: 28 Ledna 2013, 10:52:07 »
$ sudo aptitude install fdupes
$ man fdupes


FDUPES(1)                                                            FDUPES(1)

NAME
       fdupes - finds duplicate files in a given set of directories

SYNOPSIS
       fdupes [ options ] DIRECTORY ...

DESCRIPTION
       Searches  the  given  path for duplicate files. Such files are found by
       comparing file sizes and MD5 signatures,  followed  by  a  byte-by-byte
       comparison.


compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #5 kdy: 28 Ledna 2013, 10:54:26 »
$ sudo aptitude install fdupes
$ man fdupes

Díky.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6322
Re:Jak najít duplicitní soubory?
« Odpověď #6 kdy: 28 Ledna 2013, 11:02:44 »
Aktualizoval jsem časy.

Mimochodem díky za tip. Zjistil jsem, že mám některé fotky až 12krát :D


[příloha smazaná administrátorem]
« Poslední změna: 28 Ledna 2013, 11:04:35 od Roman "Rovano" Vacho »
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem.

Prosím označit text kódu v editoru # pro lepší formátování textu případného výpisu. Děkuji.

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Jak najít duplicitní soubory?
« Odpověď #7 kdy: 28 Ledna 2013, 15:39:10 »
Tak, ještě neco co by nahradilo duplicity hardlinkem :)
Ale to se poddá...
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

Tadeáš Pařík

  • Předseda občanského sdružení Ubuntu ČR a člen placené komunitní podpory
  • Příspěvků: 6543
    • Ubuntu.cz
Re:Jak najít duplicitní soubory?
« Odpověď #8 kdy: 28 Ledna 2013, 17:20:05 »
$ sudo aptitude install fdupes
$ man fdupes


FDUPES(1)                                                            FDUPES(1)

NAME
       fdupes - finds duplicate files in a given set of directories

SYNOPSIS
       fdupes [ options ] DIRECTORY ...

DESCRIPTION
       Searches  the  given  path for duplicate files. Such files are found by
       comparing file sizes and MD5 signatures,  followed  by  a  byte-by-byte
       comparison.

Díky za tip.

Kód: [Vybrat]
fdupes -rnA cesta_k_adresari/
funguje bezvadně! +1
Do života je třeba mít připravený rozum, nebo provaz.

Ubuntu 14.04 64 bit / Windows 10 Pro - Intel DH87MC, Intel Core i7-4771, 8GB Ram, Kingston HyperX 3K SSD 120GB, Intel HD 4600 a ASUS GTX660-DC2OCPH-2GD5
Ubuntu 14.04 64bit - HP ProBook 4525s
Ubuntu 14.10 32bit - ThinkPad R52 (testování)

pariktadeas@jabbim.cz

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6322
Re:Jak najít duplicitní soubory?
« Odpověď #9 kdy: 28 Ledna 2013, 17:26:50 »
Najde to i ty, co se liší velikostí? Ale třeba obsah je na 99% stejnej?
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem.

Prosím označit text kódu v editoru # pro lepší formátování textu případného výpisu. Děkuji.

beer

  • Host
Re:Jak najít duplicitní soubory?
« Odpověď #10 kdy: 28 Ledna 2013, 17:48:46 »
Tak, ještě neco co by nahradilo duplicity hardlinkem :)
Ale to se poddá...

Co takhle to přesypat na oddíl s BTRFS?

jmp

  • Host
Re:Jak najít duplicitní soubory?
« Odpověď #11 kdy: 28 Ledna 2013, 18:20:01 »
Najde to i ty, co se liší velikostí? Ale třeba obsah je na 99% stejnej?
IMHO ne

Citace
Searches  the  given  path for duplicate files. Such files are found by
       comparing file sizes and MD5 signatures,  followed  by  a  byte-by-byte
       comparison.

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6322
Re:Jak najít duplicitní soubory?
« Odpověď #12 kdy: 28 Ledna 2013, 19:53:26 »
Tak už fachší. Snad nesežere celou paměť :-)
Edit: tak už je po něm :-( Asi jsem toho po něm chtěl moc.

[příloha smazaná administrátorem]
« Poslední změna: 28 Ledna 2013, 20:28:57 od Roman "Rovano" Vacho »
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem.

Prosím označit text kódu v editoru # pro lepší formátování textu případného výpisu. Děkuji.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #13 kdy: 29 Ledna 2013, 10:47:50 »
Ten digikam celou noc dělal otisky a ráno nějaký duplicity našel, ale zatím jsem neměl čas to ověřit...
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Jak najít duplicitní soubory?
« Odpověď #14 kdy: 29 Ledna 2013, 10:58:31 »
Tak, ještě neco co by nahradilo duplicity hardlinkem :)
Ale to se poddá...

Co takhle to přesypat na oddíl s BTRFS?

Až bude btrfs šifrovatelný (truecryptem), tak klidně :)
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #15 kdy: 30 Ledna 2013, 10:12:36 »
Digikam funguje pěkně a i docela svižně, na to, že mám fotek 280GB. Mám však jeden problém, i při nastavení shody duplicity 100% najde snímky, které jsou pouze podobné. Respektive se jedná například o výřez, nebo mírnou změnu barvy, nebo i změnu rozlišení.

Nepřišel jsem na to, jak nastavit, že za 100% shodné považuji pouze snímky, kde se obraz 100% shoduje, tj pixel na pixel ani pixel jinak!

Dále prosím o radu, jak vyhledávat podle více štítků. Například všechny fotky, jde je Dryml i Šlouf.

Dále neumím nastavit, aby se pod náhledem snímku zobrazovala velikost souboru.

Díle neumím nastavit, aby si databázi o snímcích z externího disku ukládal na externí disk a databázi interních snímků na interní. Chtěl bych ho používat někdy s připojením externího disku, někdy bez.

Díky za tipy a rady.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

ntz_reloaded

  • Lokaj
  • Závislák
  • ***
  • Příspěvků: 3735
  • skill :: ur home erly
Re:Jak najít duplicitní soubory?
« Odpověď #16 kdy: 30 Ledna 2013, 13:56:02 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity
tikejte mi, taky Vam tikam ...
song of the day - openSUSE, openindiana, DuckDuckGo
The noise ain't noise anymore, who's to blame, WHO'S TO BLAME ??

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #17 kdy: 30 Ledna 2013, 14:22:29 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity

Pozor, snímky se liší (mírně) velikostí, názvem i EXIFem apod.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Jak najít duplicitní soubory?
« Odpověď #18 kdy: 30 Ledna 2013, 14:23:14 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity

Pozor, snímky se liší (mírně) velikostí, názvem i EXIFem apod.

Pak to nejsou duplicity. Mateš všechny okolo.
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #19 kdy: 30 Ledna 2013, 14:29:10 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity

Pozor, snímky se liší (mírně) velikostí, názvem i EXIFem apod.

Pak to nejsou duplicity. Mateš všechny okolo.

Čtěte pozorněji:
Nepřišel jsem na to, jak nastavit, že za 100% shodné považuji pouze snímky, kde se obraz 100% shoduje, tj pixel na pixel ani pixel jinak!

Jedná se o snímky. Duplicitní snímky, ne soubory. Nepsal jsem bit na bit, ale pixel na pixel.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Jak najít duplicitní soubory?
« Odpověď #20 kdy: 30 Ledna 2013, 14:32:52 »
potřebuji na externím disku s fotografiemi (cca 290 GB) vyhledat duplicitní soubory. Soubory se mohou lišit názvem, datem, příponou, ale mají shodný obsah. Je to vůbec amatérsky možné?
Piš pozorněji.
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

beer

  • Host
Re:Jak najít duplicitní soubory?
« Odpověď #21 kdy: 30 Ledna 2013, 14:43:26 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity

Toto by mělo fungovat tak jak potřebuješ. Jiná možnost zřejmě nebude, nežli přes kontrolní součty.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #22 kdy: 30 Ledna 2013, 14:44:28 »
potřebuji na externím disku s fotografiemi (cca 290 GB) vyhledat duplicitní soubory. Soubory se mohou lišit názvem, datem, příponou, ale mají shodný obsah. Je to vůbec amatérsky možné?
Piš pozorněji.

Omlouvám se. Moje chyba.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

compaq

  • Závislák
  • ***
  • Příspěvků: 2524
  • Díky všem za rady a tipy.
Re:Jak najít duplicitní soubory?
« Odpověď #23 kdy: 30 Ledna 2013, 14:46:19 »
find $nekde -type f -exec md5sum {} \; >/soubor/s/logem

potom normalne pomoci grepu a sortu zjistis duplicity

Toto by mělo fungovat tak jak potřebuješ. Jiná možnost zřejmě nebude, nežli přes kontrolní součty.

Pozor, snímky se liší (mírně) velikostí souboru, názvem i EXIFem apod.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

beer

  • Host
Re:Jak najít duplicitní soubory?
« Odpověď #24 kdy: 30 Ledna 2013, 16:30:52 »
Tak v tom případě se nejedná o duplicitu.

 

Provoz zaštiťuje spolek OpenAlt.