Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: Jak hledat soubory, podle textu, který obsahují?  (Přečteno 10135 krát)

compaq

  • Závislák
  • ***
  • Příspěvků: 2453
  • Díky všem za rady a tipy.
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #25 kdy: 24 Ledna 2013, 12:56:39 »
Tak se ještě jukni na ty CLI utilitky, co jsem Ti postoval. Třeba to nějaká umí. A potom můžeš užít ten Catfish.

Díky.

Abyste mě pochopili. Mám archiv (na externím disku) od roku 1993. Celkem cca 42GB, 88000 souborů. Obsahuje staré dokumenty z MS Officu, dokumenty ze starého OOO, z nového OOO z Libre, poštu, RTF, TXT, WRI, htm, zipy i PDF i skeny. Potřebuji najít všechny dokumenty, kde se objevilo například slovo "Paroubek", Paroubek + Šlouf v obsahu i v názvu atd...
Když se výsledků objeví mnoho, chci upřesnit dobu vytvoření, například 2002-2004 apod. Nebo také dobu editace 2004-2006, případně typ soubor atd. atd. atd.

Chápu, že ze zaheslovaných souborů a ze skenů se nic nenajde, ale....

Zatím to musím dělat pomocí starého stroje, kde běží WXP. Je to dost nepohodlné. Rád bych na to využil Ubuntu...
« Poslední změna: 24 Ledna 2013, 13:02:10 od compaq »
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

ntz_reloaded

  • Lokaj
  • Závislák
  • ***
  • Příspěvků: 3735
  • skill :: ur home erly
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #26 kdy: 24 Ledna 2013, 13:27:45 »
OMG .. jak chces prohledavat ty *jelito pomoci grepu (plaintext) nejake stare .doc, .rtf, .whatever ? ty to delas naschval, ze nas (me) takhle moris ? ja uz jsem nad tebou kompagu hul zlomil driv, tedka jsem ji *rozcvrtil (jeste rozlamal ty dve pulky) .. to se neda s tebou .. ty nemas prosim kolem sebe zadneho (zodpovedneho) dospeleho, na ktereho *nejdriv by jsi smeroval sve IT dotazy a pripadne kdyby nevedel, tak by jsi se zeptal tady ? neslo by to prosim delat takhle ?
tikejte mi, taky Vam tikam ...
song of the day - openSUSE, openindiana, DuckDuckGo
The noise ain't noise anymore, who's to blame, WHO'S TO BLAME ??

C++odeG++irl-o.cc

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #27 kdy: 24 Ledna 2013, 13:35:33 »
Tak na ubuntu budeš muset použít více nástrojů asi. Můžeš si na to napsat script. Na pdf použij ten pdfgrep v dalším dotazu jsi se ptal na příkaz co vyhledává podle data editace + se podívej třeba tady, nezkoušela jsem to... http://www.techrepublic.com/blog/opensource/how-to-search-for-text-inside-many-opendocument-files/3696

ntz_reloaded

  • Lokaj
  • Závislák
  • ***
  • Příspěvků: 3735
  • skill :: ur home erly
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #28 kdy: 24 Ledna 2013, 13:39:43 »
Tak na ubuntu budeš muset použít více nástrojů asi. Můžeš si na to napsat script. Na pdf použij ten pdfgrep v dalším dotazu jsi se ptal na příkaz co vyhledává podle data editace + se podívej třeba tady, nezkoušela jsem to... http://www.techrepublic.com/blog/opensource/how-to-search-for-text-inside-many-opendocument-files/3696

jen si dovolim doplnit, ze existujou utility (a pluginy) co prohledavaji i MS dokumenty a vsechno mozny .. vzpominam si - ted v kde neni a ten nepomuk je uplne na prd - ze beagle jeste s KDE3 umel indexovat vc obsahu tento druh souboru, mejly, atd ..

sam ti tady prihreju polivcicku - Vy, kdo pamatujete beagla (prvnich par let jsem ho nesnasel, potom jsem si ho zamiloval) - existuje nejaka plnohodnotna nahrada v dnesni dobe (pro kde) ?
tikejte mi, taky Vam tikam ...
song of the day - openSUSE, openindiana, DuckDuckGo
The noise ain't noise anymore, who's to blame, WHO'S TO BLAME ??

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6024
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #29 kdy: 24 Ledna 2013, 18:20:42 »
Beagla pamatuju.

Zkusmo jsem vytvořil soubor a čekám, až se naindexuje.
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem. Děkujeme.

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6024
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #30 kdy: 24 Ledna 2013, 19:07:36 »
Výsledek z Nepomuku(Strigi) KDE 4.9.4 je:
Našel mě(hledal jsme své jméno) jak ve vytvořeném souboru test.odt, tak v texťákách a docech a dokonce i pdfkách, kde je mé jméno na faktuře. Připojil dokonce i 2 obrázky, až jsem se lekl, že má nějakou detekci ksichtů. Naštěstí to byla jen chyba hledání. Pokud tam není nějaký skrytý vodoznak :D

Hledání bylo provedeno v Dolphinu. Krusader mi výsledky nezobrazil. Asi neumí obsah nebo na to není defaultně nastavenej.
« Poslední změna: 24 Ledna 2013, 19:12:45 od Roman "Rovano" Vacho »
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem. Děkujeme.

RNA

  • Stálý člen
  • **
  • Příspěvků: 630
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #31 kdy: 24 Ledna 2013, 20:06:34 »
ale v obsahu dokumentů ODT, ODS stejně nic nenajde...
Protože to tam zkrátka a jednoduše není. zkuste si otevřít nějaký soubor.odt v hexa editoru. Pochopíte proč.
Aby se našlo něco, co je jeví jako imanentní jsoucno v souboru odt, který je otevřen v nějakém tom OpenOffice, tak je třeba ten soubor interpretovat jako formát odt. Je tedy k tomu zapotřebí zobrazovací část OpenOffice. A totéž platí pro jakýkoliv jiný soubor. Universální hledací program by tedy musel obsahovat kód programů OpenOffice, Excel, Tex, Microsoft Word, Power Point, a tak dále pro všechny známé binární formáty !!! A to ještě ve všech používaných kódováních. Vy nechcete program, který hledá vzorek v souboru, ale program, který interpretuje obsah souboru podle jeho přípony (??) a teprve v takto vytvořeném souboru hledá. Když si uvědomíte, kolik je různých možných formátů, tak byste  měl dospět k poznání, že je velmi rozumné od této myšlenky ustoupit.


aloisam

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #32 kdy: 24 Ledna 2013, 20:49:05 »
Výsledek z Nepomuku(Strigi) KDE 4.9.4 je:
Našel mě(hledal jsme své jméno) jak ve vytvořeném souboru test.odt, tak v texťákách a docech a dokonce i pdfkách, kde je mé jméno na faktuře. Připojil dokonce i 2 obrázky, až jsem se lekl, že má nějakou detekci ksichtů. Naštěstí to byla jen chyba hledání. Pokud tam není nějaký skrytý vodoznak :D

Hledání bylo provedeno v Dolphinu. Krusader mi výsledky nezobrazil. Asi neumí obsah nebo na to není defaultně nastavenej.

ok, takže řešením je nějaký "indexer", nebo jak to nazvat. :) Pro ubuntu/gnome asi tohle ne? http://projects.gnome.org/tracker/index.html

Roman Vacho

  • Moderátor
  • Závislák
  • ***
  • Příspěvků: 6024
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #33 kdy: 24 Ledna 2013, 22:40:14 »
Vy se tu hádáte, ale já jsem vykoumal, že alespoň nějaké binárky mi Dolphin v KDE najde. Schválně jsem zkoušel bez dekódování v nich hledat řetezce, pomocí kterého mi je našel Dolphin z databáze Strigi/Nepomuku, a nenašel jsem je. Co to znamená? Že alespoň ODT a PDF a DOC dle standardů (XP), atd Strigi/Nepomuk s pomocí něčeho přelouská!

Pro Compaqa:
Tohle je nějaký obsah souboru, ať se nazývá jakkoliv:
Kód: [Vybrat]
file:///home/rovano/compaq.odt application/vnd.oasis.opendocument.text
Takhle vypadá třeba binární:
Kód: [Vybrat]
snůška nesmyslných znakůZobrazí se podle toho, v jaké je otevřeš znakové sadě. A působí to jako marťanština.
Musíš k nim mět "dekodér".

Zkus si editovat nějaký exe soubor.
« Poslední změna: 24 Ledna 2013, 22:47:17 od Roman "Rovano" Vacho »
Vyřešená vlákna je vhodné uzavřít "Topic Solved" dole pod vláknem. Děkujeme.

RNA

  • Stálý člen
  • **
  • Příspěvků: 630
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #34 kdy: 25 Ledna 2013, 09:07:25 »
Kancelářský balík, který neumí prohledávat ve svých vlastních souborech.......
On to Open(Libre)Office neumí? To jsem si nevšiml a vesele si vyhledávám.

Tak ještě jednou: Vyhledávání řetězce, jehož skutečný tvar je závislý na aplikační vrstvě, nelze provádět univerzálním prostředkem, ale pouze zaměřeným na tu konkrétní aplikaci. Toto pochopí každý člověk alespoň se středním vzděláním technického směru.
Teď z tebe vypadlo, že chceš vyhledávat texty v souborech ODT. Pokud bys použil google, našel bys: http://bit.ly/YrwHbr


Struktura ODT souboru mě (jako uživatele) vůbec, ale vůbec, nezajímá...
Jasně, ty je chceš prohledávat pomocí grepu a struktura tě vůbec nezajímá.
A já zase chci jezdit autem a takové technické detaily jako rozdíl mezi naftou a benzínem, nebo význam dopravních značek mě (jako uživatele) vůbec, ale doopravdy vůbec nezajímají.


compaq

  • Závislák
  • ***
  • Příspěvků: 2453
  • Díky všem za rady a tipy.
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #35 kdy: 25 Ledna 2013, 09:23:03 »
On to Open(Libre)Office neumí? To jsem si nevšiml a vesele si vyhledávám.

Nechápu, prosím tě, jak vyhledám ve složce i podsložkách soubory ODT (ODS), které obsahují klíčové slovo Pomocí LibreOffice? Díky za odpověď.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

compaq

  • Závislák
  • ***
  • Příspěvků: 2453
  • Díky všem za rady a tipy.
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #36 kdy: 25 Ledna 2013, 09:34:58 »
Pokud bys použil google, našel bys: http://bit.ly/YrwHbr

Díky za tip. K+ DocSearcher hned napoprvé soubory našel a zatím nejúspěšněji (75% - nenašel PDF soubor se skenem, který má klíčové slovo v názvu).
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

RNA

  • Stálý člen
  • **
  • Příspěvků: 630
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #37 kdy: 25 Ledna 2013, 09:54:51 »
Nechápu, prosím tě, jak vyhledám ve složce i podsložkách soubory ODT (ODS), které obsahují klíčové slovo Pomocí LibreOffice? Díky za odpověď.
Odpověď: nevím.

Kancelářský balík, který neumí prohledávat ve svých vlastních souborech je zcela na prd,....
Umí. např. pomocí Ctrl-F.
(To je ale jinak postavená otázka)

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #38 kdy: 25 Ledna 2013, 10:14:37 »
Řešení pro compaqa:
na analýzu a ukládání strukturovaných nebo nestrukturovaných dat můžeš použít nějaký komerční produkt, tyto produkty neznám, ale existují, třeba některý umí to, co požaduješ, již jsem je zmínil na jednom místě:

Ta integrace není jednoduchá záležitost, zabývají se tím velké firmy typu Red Hat (Storage Software Appliance,...), Novell (Novell File Management Suite, Novell File Reporter, Novell Storage Manager, Novell Dynamic File Services) nebo Oracle (Oracle Big Data Appliance, Oracle Endeca Information Discovery), IBM, SAP.

Tyto produkty neznám, jen vím, že takové produkty existují.

2. návrh:
google drive  - své dokumenty tam importovat. Dokonce si poradí i s texty v obrázcích nebo pdf /pokud to rozsáhlé soubory/ - je tam integrované OCR.

compaq

  • Závislák
  • ***
  • Příspěvků: 2453
  • Díky všem za rady a tipy.
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #39 kdy: 25 Ledna 2013, 10:25:39 »
Pro beer:

Díky za rozumnou odpověď. K+

Vyzkoušel jsem nějaká dema komerčních produktů a byl jsem rozhodnutý, že ten, který vyhledá 100% testovacích souborů zakoupím. Bohužel ani jeden to nezvládl a kupovat víc komerčních produktů a sledovat "ten umí to a ten zas tohle" se mi z principu nechce.

Na ten google drive se podívám, ale jak jsem psal výše, jedná se o 40GB/88000 souborů, některé jsou stomegové PPT, PDF apod.
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #40 kdy: 25 Ledna 2013, 10:42:31 »
Citace
Tarify úložiště Google

Zvolte si některý z následujících měsíčních tarifů úložiště Google, které můžete využívat pro Disk Google nebo Picasu. Při zakoupení některého z těchto tarifů bude váš limit úložiště Gmailu automaticky zvýšen na 25 GB. Roční tarify momentálně nejsou dostupné.
Úložný prostor    Měsíční sazba
25 GB    2,49 USD
100 GB    4,99 USD
200 GB    9,99 USD
400 GB    19,99 USD
1 TB    49,99 USD
2 TB    99,99 USD
4 TB    199,99 USD
8 TB    399,99 USD
16 TB    799,99 USD

Zdarma máš 5 GB.
Můžeš používat více účtů najednou, využiješ li neoficiálního klienta:

otevři terminál jako root:
Kód: [Vybrat]
gksudo gnome-terminal
Kód: [Vybrat]
wget -O- https://d2t3ff60b2tol4.cloudfront.net/services@insynchq.com.gpg.key | apt-key add -pak zadáš:
Kód: [Vybrat]
echo -e "\n### Google Drive Insynchq\n## https://www.insynchq.com/linux\ndeb http://apt.insynchq.com/ubuntu  quantal non-free" >> /etc/apt/sources.listpotom stačí aktualizovat seznam balíků a nainstalovat:
Kód: [Vybrat]
apt-get update; apt-get install insync-beta-ubuntu

compaq

  • Závislák
  • ***
  • Příspěvků: 2453
  • Díky všem za rady a tipy.
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #41 kdy: 25 Ledna 2013, 10:53:07 »
Kód: [Vybrat]
apt-get update; apt-get install insync-beta-ubuntu

Citace
Vytvářím strom závislostí       
Čtu stavové informace... Hotovo
Některé balíky nemohly být instalovány. To může znamenat, že požadujete
nemožnou situaci, nebo, pokud používáte nestabilní distribuci, že
vyžadované balíky ještě nebyly vytvořeny nebo přesunuty z Příchozí fronty.
Následující informace vám mohou pomoci vyřešit tuto situaci:

Následující balíky mají nesplněné závislosti:
  insync-beta-ubuntu: Závisí na: libappindicator3-1 ale nedá se nainstalovat
E: Poškozené balíky

U10.04  >:(
Pokud vám vaše holka či manželka funguje jak má, neměňte jí za mladší, zaděláte si na problém. Stejně to dělejte i s Ubuntu.

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #42 kdy: 25 Ledna 2013, 11:09:50 »
Ten zdroj je pro quantal. Pokud máš jiné ubuntu, například 12.04, tak pro 12.04 zedituj soubor /etc/apt/sources.list a nahraď slovo quantal slovem precize.

Měl by to být nyní poslední řádek toho souboru:

nynější stav odpovídající ubuntu 12.10
### Google Drive Insynchq
## https://www.insynchq.com/linux
deb http://apt.insynchq.com/ubuntu  quantal non-free


a takto by to mělo vypadat v ubuntu 12.04
### Google Drive Insynchq
## https://www.insynchq.com/linux
deb http://apt.insynchq.com/ubuntu  precize non-free


Potom opět
Kód: [Vybrat]
apt-get update; apt-get install insync-beta-ubuntu.

Pokud nepůjde, zkus nainstalovat aptitude a aktualizovat systém a až potom instalovat, předpokládám, že máš potřebné ubuntí repozitáře, dají se generovat zde: http://repogen.simplylinux.ch/generate.php

Kód: [Vybrat]
sudo apt-get install aptitude; sudo aptitude update; sudo aptitude upgrade; sudo aptitude install insync-beta-ubuntuPokud máš nějaké staré ubuntu, tak můžeš zkusit nahradit jeho názvem, nicméně nevím, jestli podporují nějaké zastaralé verze.
« Poslední změna: 25 Ledna 2013, 11:12:37 od beer »

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #43 kdy: 25 Ledna 2013, 11:19:16 »
Na webu neuvádějí, které nejstarší ubuntu podporují, můžeš zkusit nahradit za lucid, když nebude fungovat, tak můžeš zkusit insync pro mate, to by mohlo být kompatibilní:

Kód: [Vybrat]
sudo apt-get install insync-beta-mate
nebo verzi pro XFCE:
Kód: [Vybrat]
sudo apt-get install insync-beta-xfce

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #44 kdy: 25 Ledna 2013, 11:29:56 »
Teď jsem si všiml, že máš U 10.04. Možná konečně důvod přejít na novější verzi systému, co říkáš ;). Na 12.04.
Nemůže.

Nevadí, i zde je řešení, bez možnosti automatické synchronizace.
Můžeš používat tedy webové rozhraní. Stejně ten samotný import bych doporučil udělat tak jako tak přes webové rozhraní.

Na otestování gmail zdarma, pokud bude fungovat,můžeš jich mít 8*5 GB zdarma, to máme těch 40 GB místa.
Utřídit si to podle tématu, nebo podle let a podle toho to nahrát.

beer

  • Host
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #45 kdy: 25 Ledna 2013, 12:08:28 »
Co ten import do google drive, už sis vyzkoušel? Vlastně ani synchronizaci nepotřebuješ, protože jestli chápu tvé potřeby, tak ty stará data pouze jen archivuješ, již je neměníš.

Archivace a vyhledávání dat je určitě důležitá věc, to musím s compaqem souhlasit, obzvláště je to významné ve firemním prostředí, kde je potřeba dodržovat zákony na ochranu osobních údajů a normy týkající se archivace a skartace dat. Dále je důležité potřebný dokument snadno najít, fulltextové vyhledávání je ideální. Dále je ideální přidat nějaká ta strukturovaná metadata, pokud samotná data nejsou strukturována (štítky, tagy, exif informace, atd). Ale v tomto rozsahu pozor, aby to neskončilo duševní poruchou. Když se hromadí fyzické věci, říká se tomu kompulzivní hromadění. Pokud je v tom nějaký pořádek a smysl, tak se tomu říká sběratelství. Nic se nemá přehánět :) a v dnešním digitálním vesmíru vstupujeme do nové éry, kdy můžeme hlava nehlava hromadit informace digitální. Pokud jsou ty informace důležité, tak byť je to svým způsobem posedlost, tak to jakýsi smysl má. Pokud by to byly informace nedůležité, tak je to ztráta času a energie.
« Poslední změna: 25 Ledna 2013, 12:13:44 od beer »

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #46 kdy: 25 Ledna 2013, 12:24:36 »
Blbosti jsem přesunul do Srdíčka, reklamace prosím na nádraží, peron 39/4...
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

jadd

  • Stálý člen
  • **
  • Příspěvků: 977
Re:Jak hledat soubory, podle textu, který obsahují?
« Odpověď #47 kdy: 04 Února 2013, 01:21:04 »
Mohla by se vám hodit informace od Tomáše Bžatka http://www.abclinuxu.cz/poradna/linux/show/299845

 

Provoz zaštiťuje spolek OpenAlt.