- pipina je super - staci si udelat balik (tj de fakto jen setup.py) a muzes instaloval primo z
http://pypi.python.org/pypi nebo odkudkoliv odjinud (klasicky github)
- no enumerate ti ulevi od toho si delat pred cyklem counter a jeho inkrementace v nem, nehlede na to, ze je to build-in.
ja sem se tam upsal - psal sem to po pameti, spravne to ma bejt takle a z toho uz ti to asi bude jasnejsi:
In [3]: for i,one in enumerate(range(10,20)): print i, one
0 10
1 11
2 12
3 13
4 14
5 15
6 16
7 17
8 18
9 19
- lambda (anonymni funkce) je fajn, ale nesmi se to s ni prehanet
- kopypasta - tim myslim, ze nejakej kode sem tam videl minimalne 2x stejnej
- ad logging: je to strasne mocny, nehlede na to, ze si muzes napsat vlastni handlery a soupat si to kamkoliv. super je treba kombinace raven+sentry. Onehda sem trosku pomahal s log4mongo
https://github.com/starenka/log4mongo-python- ad mechanize: no, pokud ti muzu radit, tak pokud chces zustat dusevne zdravej, urlib se vyhni. je to docela monstrum, timeouty musis clovek resit socketama, gzip, hlavicky, cookies taky nic moc atd... trosku zbytecne lowlevel a bordel. requests je luxusni knihovna s minimem zavislosti (tusim, ze snad jen simplejson). na pipine a githubu jsou ziliony projektu, nema cenu vynalejzat kolo a psat si to sam (imo)
tak at ti to slape, drzim palce
ps. ad rychlost, zkus to vzit gzipem (poslat hlavicku, ze umis gzip, mohlo by to pomoct), na takle malejch strankach asi nebude mezi knihovnama znatelnej rozdil v parsovani....
pps. mozna by si moh brat prihlasovaci udaje z klasickyho ~/.netrc - takle specifikovany pres lajnu pak visi v historii shellu a to neni asi uplne nejlepsi...