Pokud si CSV převedeš do JSONL, což je podle mě vhodnější formát pro data, tak potom doporučuji utilitu jq, je to něco jako XPath pro JSON: https://stedolan.github.io/jq/ A díky streamování můžeš i zpracovávat data, která se ti nevejdou ani do paměti, a paralelizovat přes všechna CPU (nebo si CPU vypůjčit z cloudu), kdyby náhodou někdy bylo potřeba.
Dne 5. března 2018 16:02 Petr Messner <petr.mess...@gmail.com> napsal(a): > No, je na to jeden takový super jazyk - Python :) > > I když teda existuje jazyk, ve kterém se nějaké adhoc datové transformační > pipelines dělají ještě lépe - Javascript. Škoda, že Python list nemá metodu > map, musí se to dělat minimálně přes list comprehensions, což je sice > obecnější, ale o něco pomaleji se to píše. > > Pro old-schoolery potom grep, sed a awk. > > > Dne 5. března 2018 14:31 Vláďa Macek <ma...@sandbox.cz> napsal(a): > > Zdar, >> >> mějme tabulková data načtená třeba z CSV nebo Google Tabulku. Víte o >> elegantním nástroji (modulu) pro Python implementujícím jednoduchý >> dotazovací jazyk? >> >> Jako "dej mi všechny řádky, které mají ve sloupci B hodnotu V (příp. >> regexp), ve sloupci C nemají hodnoty V1 ani V2" atd. >> >> Jde mi o etablovanou věc. Ne něco spíchnutého pro vlastní potřebu a hrdě >> zveřejněného, aby si autor otestoval psaní setup.py. :-) >> >> Díky, >> >> V. >> >> >> _______________________________________________ >> Python mailing list >> python@py.cz >> http://www.py.cz/mailman/listinfo/python >> >> Visit: http://www.py.cz >> > >
_______________________________________________ Python mailing list python@py.cz http://www.py.cz/mailman/listinfo/python Visit: http://www.py.cz