Re: [Python] [OT] Cheap MapReduce in Go

2015-07-16 Per discussione Massimiliano Pippi
Ciao GollumOne!

2015-07-16 10:02 GMT+02:00 Gollum1 gollum1.smeag...@gmail.com:

 Ma esiste una ml di utenti italiani di go? Potremmo anche crearla, almeno 
 queste cose non sarebbero più ot.

Stavo per segnalarlo ma non sapevo bene come fare a non sembrare
bacchettone ma visto che sei andato avanti tu... :)
Si c'è:

https://groups.google.com/forum/#!forum/golangit

è a scarsissimo traffico ed è un peccato, le discussioni fatte qui
negli ultimi mesi meritavano di andare di là, o meglio, gente che sta
di là meritava di assistere alle discussioni in oggetto.

 Oppure modifichiamo il nome a questa lista, visto che sono più i post su go 
 (peraltro interessantissimi) che i post su python.

Sì, ultimamente l'OT è una fetta importante del traffico :P

 Certo, è difficile differenziale totalmente, visto che la maggior parte dei 
 post nascono come comparazione.

Se di là sono daccordo, a me il crosspost quando è utile piace

Buon fresco

-- 
M.

@maxpippi :: http://dev.pippi.im/
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] [OT] Cheap MapReduce in Go

2015-07-16 Per discussione Gollum1
Il 14 luglio 2015 07:51:36 CEST, Giovanni Porcari 
giovanni.porc...@softwell.it ha scritto:

 Il giorno 14/lug/2015, alle ore 01:37, enrico franchi
enrico.fran...@gmail.com ha scritto:
 
 
 2015-07-14 0:28 GMT+01:00 enrico franchi enrico.fran...@gmail.com:
 
 
 On Mon, Jul 13, 2015 at 7:35 PM, Riccardo Magliocchetti
riccardo.magliocche...@gmail.com wrote:
 
 Qualche tempo fa era uscito qualcosa del genere dove veniva usata una
commovente pipeline:

http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html
 
 E vorrei vedere! Chiunque faccia big data per davvero concorderebbe:
2 GB non e' abbastanza per pagare l'overhead di Hadoop e compagnia
briscola. E ancora grep-sized. 
 
 
 Comunque l'articolo e' spettacolare. Anche la metodologia e' molto
solida e rigorosa. Piacevole lettura, grazie! 
 
 


Concordo. Piacevolissimo e istruttivo.
Questa è la vera differenza tra farsi le ‘pippe' e farsi le ‘pipe’ ;)

G
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Ma esiste una ml di utenti italiani di go? Potremmo anche crearla, almeno 
queste cose non sarebbero più ot.

Oppure modifichiamo il nome a questa lista, visto che sono più i post su go 
(peraltro interessantissimi) che i post su python.

Certo, è difficile differenziale totalmente, visto che la maggior parte dei 
post nascono come comparazione.

Buon Caronte a tutti (qui si boccheggia).

Byez
-- 
Gollum1
Teoro, dov'è il mio teoro

Inviato dal mio dispositivo Android con K-9 Mail. Perdonate la brevità e gli 
errori di battitura (maledetto correttore automatico).
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] [OT] Cheap MapReduce in Go

2015-07-13 Per discussione Giovanni Porcari

 Il giorno 14/lug/2015, alle ore 01:37, enrico franchi 
 enrico.fran...@gmail.com ha scritto:
 
 
 2015-07-14 0:28 GMT+01:00 enrico franchi enrico.fran...@gmail.com:
 
 
 On Mon, Jul 13, 2015 at 7:35 PM, Riccardo Magliocchetti 
 riccardo.magliocche...@gmail.com wrote:
 
 Qualche tempo fa era uscito qualcosa del genere dove veniva usata una 
 commovente pipeline:
 http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html
 
 E vorrei vedere! Chiunque faccia big data per davvero concorderebbe: 2 GB non 
 e' abbastanza per pagare l'overhead di Hadoop e compagnia briscola. E ancora 
 grep-sized. 
 
 
 Comunque l'articolo e' spettacolare. Anche la metodologia e' molto solida e 
 rigorosa. Piacevole lettura, grazie! 
 
 


Concordo. Piacevolissimo e istruttivo.
Questa è la vera differenza tra farsi le ‘pippe' e farsi le ‘pipe’ ;)

G
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] [OT] Cheap MapReduce in Go

2015-07-13 Per discussione Riccardo Magliocchetti

Il 13/07/2015 20:20, Carlo Miron ha scritto:

 http://marcio.io/2015/07/cheap-mapreduce-in-go/

tl;dr

Sometimes you don’t need overly complex infrastructures or systems to do a job
well. In this case, we were running these exact same aggregations over close to
20 EMR instances that would take a few minutes to execute the entire MapReduce
job over hundreds of Gigabytes of data each day.

When we decided to take a look at this problem again, we rewrote this task using
Go, and we now simply run this on a single 8-core machine and the whole daily
execution takes about 10 minutes. We cut a lot of the costs associated with
maintaining and running these EMR systems and we just schedule this Go app to
run once a day over our daily dataset.

You can find the entire code here:
https://gist.github.com/mcastilho/e051898d129b44e2f502


Qualche tempo fa era uscito qualcosa del genere dove veniva usata una commovente 
pipeline:

http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html

--
Riccardo Magliocchetti
@rmistaken

http://menodizero.it
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


[Python] [OT] Cheap MapReduce in Go

2015-07-13 Per discussione Carlo Miron
 http://marcio.io/2015/07/cheap-mapreduce-in-go/

tl;dr

Sometimes you don’t need overly complex infrastructures or systems to do a
job well. In this case, we were running these exact same aggregations over
close to 20 EMR instances that would take a few minutes to execute the
entire MapReduce job over hundreds of Gigabytes of data each day.

When we decided to take a look at this problem again, we rewrote this task
using Go, and we now simply run this on a single 8-core machine and the
whole daily execution takes about 10 minutes. We cut a lot of the costs
associated with maintaining and running these EMR systems and we just
schedule this Go app to run once a day over our daily dataset.

You can find the entire code here:
https://gist.github.com/mcastilho/e051898d129b44e2f502

©

-- 
|:**THE BEER-WARE LICENSE** (Revision 42):
| ca...@golang.it wrote this mail. As long as you retain
| this notice you can do whatever you want with this stuff.
| If we meet some day, and you think this stuff is worth it,
| you can buy me a beer in return.
|--Carlo Miron :
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] [OT] Cheap MapReduce in Go

2015-07-13 Per discussione enrico franchi
On Mon, Jul 13, 2015 at 7:35 PM, Riccardo Magliocchetti 
riccardo.magliocche...@gmail.com wrote:


 Qualche tempo fa era uscito qualcosa del genere dove veniva usata una
 commovente pipeline:

 http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html


E vorrei vedere! Chiunque faccia big data per davvero concorderebbe: 2 GB
non e' abbastanza per pagare l'overhead di Hadoop e compagnia briscola. E
ancora grep-sized.

.
..: -enrico-
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] [OT] Cheap MapReduce in Go

2015-07-13 Per discussione enrico franchi
2015-07-14 0:28 GMT+01:00 enrico franchi enrico.fran...@gmail.com:



 On Mon, Jul 13, 2015 at 7:35 PM, Riccardo Magliocchetti 
 riccardo.magliocche...@gmail.com wrote:


 Qualche tempo fa era uscito qualcosa del genere dove veniva usata una
 commovente pipeline:

 http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html


 E vorrei vedere! Chiunque faccia big data per davvero concorderebbe: 2 GB
 non e' abbastanza per pagare l'overhead di Hadoop e compagnia briscola. E
 ancora grep-sized.


Comunque l'articolo e' spettacolare. Anche la metodologia e' molto solida e
rigorosa. Piacevole lettura, grazie!



-- 
.
..: -enrico-
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python