Drillbits and duplicate files

Matt Sat, 04 Nov 2017 21:54:07 -0700

If multiple Drillbits on different servers are coordinating via Zookeeper,
and some files across the servers are duplicates (with identical
filenames), will the cluster of distributed Drillbits avoid duplicating
data on queries?


I’m specifically interested in aggregating CSV data on multiple servers,
but not in HDFS.

Drillbits and duplicate files

Reply via email to