Prosíme přihlašte se nebo zaregistrujte.

Přihlašte se svým uživatelským jménem a heslem.
Vaše pomoc je stále potřeba!

Autor Téma: Extrakce emailů[vyřešeno?]  (Přečteno 3419 krát)

Prefin

  • Aktivní člen
  • *
  • Příspěvků: 294
Extrakce emailů[vyřešeno?]
« kdy: 08 Dubna 2013, 14:34:23 »
Ahojda všichni.
Nevíte někdo jestli existuje pro Linux ekvivalent nějakého programu na extrakci emailů z webu?
Díky
« Poslední změna: 09 Dubna 2013, 10:55:00 od Roman "Rovano" Vacho »
Většinou je problém stejně mezi židlí a klávesnicí
---------------------------------------------------------------------------
Xubuntu 18.01 / W10

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Extrakce emailů
« Odpověď #1 kdy: 08 Dubna 2013, 15:09:05 »
Existuje
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

Prefin

  • Aktivní člen
  • *
  • Příspěvků: 294
Re:Extrakce emailů
« Odpověď #2 kdy: 09 Dubna 2013, 10:38:37 »
Díky
Většinou je problém stejně mezi židlí a klávesnicí
---------------------------------------------------------------------------
Xubuntu 18.01 / W10

beer

  • Host
Re:Extrakce emailů[vyřešeno?]
« Odpověď #3 kdy: 09 Dubna 2013, 11:01:42 »
To by se mi občas hodilo, když zasílám pozvánky a mám e-mailové adresy na nějaké stránce - například nějakého úřadu. Většinou to kopíruji ručně.

Které programy na to používáte?

Prefin

  • Aktivní člen
  • *
  • Příspěvků: 294
Re:Extrakce emailů[vyřešeno?]
« Odpověď #4 kdy: 09 Dubna 2013, 15:18:49 »
Používám Wokňáckej Advanced Email Extractor ale rád bych něco na linuxu ať na Wonka vůbec nemusím.
Tenhle je ale fakt dobrej. Jenom to chce zapnout prohledání pouze zadaného webu jinak bude prolejzat celej net do nekonečna.
Většinou je problém stejně mezi židlí a klávesnicí
---------------------------------------------------------------------------
Xubuntu 18.01 / W10

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Extrakce emailů[vyřešeno?]
« Odpověď #5 kdy: 09 Dubna 2013, 15:23:55 »
Rekurzivní wget se sedem to zvládnou taky
Kód: [Vybrat]
man wget
man sed
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

beer

  • Host
Re:Extrakce emailů[vyřešeno?]
« Odpověď #6 kdy: 09 Dubna 2013, 16:21:44 »
Rekurzivní wget se sedem to zvládnou taky
Kód: [Vybrat]
man wget
man sed

To by někaej programátor pomocí toho asi zvládnul, ale pochybuji, že běžný uživatel. A co jsem koukal, tak nějaké ty wokňácké extractory umí například vycucnout i jméno, ne jen e-mail, udělaj z toho tabulku, nebo to daj třeba do databáze. Sedem bych to nezvládnul a měl bych problém mu nastavit pravidla, aby vůbec rozpoznal samotný e-mail. :(

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Extrakce emailů[vyřešeno?]
« Odpověď #7 kdy: 09 Dubna 2013, 16:57:20 »
Rekurzivní wget se sedem to zvládnou taky
Kód: [Vybrat]
man wget
man sed

To by někaej programátor pomocí toho asi zvládnul, ale pochybuji, že běžný uživatel. A co jsem koukal, tak nějaké ty wokňácké extractory umí například vycucnout i jméno, ne jen e-mail, udělaj z toho tabulku, nebo to daj třeba do databáze. Sedem bych to nezvládnul a měl bych problém mu nastavit pravidla, aby vůbec rozpoznal samotný e-mail. :(

Vlastních stránek to scriptovat nepotřebuje a script kiddie si to nezaslouží.
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

beer

  • Host
Re:Extrakce emailů[vyřešeno?]
« Odpověď #8 kdy: 10 Dubna 2013, 08:42:15 »
Myslím, že ty účel může být regulerní. Naznačuješ, že jsem jakožto téměř třicátník a rodič script kiddie? Lol.

Martin Šácha

  • Člen občanského sdružení Ubuntu ČR a placené komunitní podpory
  • Administrátor fóra
  • ******
  • Příspěvků: 5153
Re:Extrakce emailů[vyřešeno?]
« Odpověď #9 kdy: 10 Dubna 2013, 08:52:56 »
Myslím, že ty účel může být regulerní. Naznačuješ, že jsem jakožto téměř třicátník a rodič script kiddie? Lol.
Aha, takže po dosažení "téměř třiceti let" a vyrobení potomka se člověk stává respektovaným h4x0r3m? :D

Znáš nějaký regulérní účel dumpování emailů z cizích webů?
Mint MATE 64bit / DuckDuckGo.com
Programátoři považují WYSIWYG za špatné u kódu i u žen. Programátor chce "dostat to, co žádá“ – kód tajemný, neodpouštějící, nebezpečný.

Tadeáš Pařík

  • Předseda občanského sdružení Ubuntu ČR a člen placené komunitní podpory
  • Příspěvků: 6543
    • Ubuntu.cz
Re:Extrakce emailů[vyřešeno?]
« Odpověď #10 kdy: 10 Dubna 2013, 08:55:04 »
Myslím, že ty účel může být regulerní. Naznačuješ, že jsem jakožto téměř třicátník a rodič script kiddie? Lol.
Aha, takže po dosažení "téměř třiceti let" a vyrobení potomka se člověk stává respektovaným h4x0r3m? :D

No a ne?  ;D
Do života je třeba mít připravený rozum, nebo provaz.

Ubuntu 14.04 64 bit / Windows 10 Pro - Intel DH87MC, Intel Core i7-4771, 8GB Ram, Kingston HyperX 3K SSD 120GB, Intel HD 4600 a ASUS GTX660-DC2OCPH-2GD5
Ubuntu 14.04 64bit - HP ProBook 4525s
Ubuntu 14.10 32bit - ThinkPad R52 (testování)

pariktadeas@jabbim.cz

beer

  • Host
Re:Extrakce emailů[vyřešeno?]
« Odpověď #11 kdy: 10 Dubna 2013, 09:56:13 »
Myslím, že ty účel může být regulerní. Naznačuješ, že jsem jakožto téměř třicátník a rodič script kiddie? Lol.
Aha, takže po dosažení "téměř třiceti let" a vyrobení potomka se člověk stává respektovaným h4x0r3m? :D

Znáš nějaký regulérní účel dumpování emailů z cizích webů?

Nevím, co je h4x0r3m :). Znám účel, ano, když chci poslat pozvánky na výstavu třeba lidem z městského úřadu a nechci na nikoho zapomenout. Zpravidla musím vykopírovat e-maily ze stránek toho úřadu a pak posílám pozvánky jednotlivě, každého oslovím jeho jménem, nebo je možné použít nějakou tu hromadnou korespondenci. Jednorázové odeslání pozvánky nepovažuji za spamování, obzvláště, pokud se například daný úřad na realizaci výstavy podílí. Beru to jako rozumnou věc, aby se i nižší úředníci byli pozváni na výstavu a nepřišli jen zástupci odborů kultury a starostové či jejich zástupci.

beer

  • Host
Re:Extrakce emailů[vyřešeno?]
« Odpověď #12 kdy: 12 Dubna 2013, 12:32:33 »
http://my.opera.com/zomg/blog/2007/07/17/collecting-email-addresses-from-websites

Kód: [Vybrat]
wget -nv -nH -r -A html --ignore-tags=img,link www.example.compak
Kód: [Vybrat]
grep -Eiorh '([[:alnum:]_.]+@[[:alnum:]_]+?\.[[:alpha:].]{2,6})' ./ > emails.txt
nebo
http://stackoverflow.com/questions/13858344/extract-email-addresses-from-a-website-using-scripts

Kód: [Vybrat]
wget -q -r -l 5 -O - http://somesite.com/ | grep -E -o "\b[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+\b
Ještě že máme ten google. A obejdeme se i bez sedu...

Ještě jsem nezkoušel funkčnost...
« Poslední změna: 12 Dubna 2013, 12:34:33 od beer »

 

Provoz zaštiťuje spolek OpenAlt.