MapReduce.it

Join the Community!

MapReduce.it fornisce la prima risorsa italiana online sulla programmazione MapReduce™ e sul framework Hadoop. Hadoop™ è un progetto open source di Apache Software Foundation in grado di fornire una computazione affidabile, scalabile e distribuita su cluster di workstation. Nonostante sia stato scritto in JAVA, le applicazioni MapReduce non necessitano di essere scritte solo in JAVA, esistono apposite librerie per C#,C++,Python. Unisciti alla community di sviluppatori. Troverai informazioni per la gestione efficiente dei dati attraverso progetti proprietari e open source che utilizzano MapReduce e Hadoop per risolvere sfidanti problemi di business analytics e data warehousing.

Big Data

Il mondo digitale sta producendo una mole crescente di dati che riguardano oggetti (Internet of Things o web 3.0), persone, notizie. Il web, come un organismo che vive e si nutre, li assorbe, li elabora e li rende condivisibili...

Spot VII Conferenza Annuale TOP-IX 2011 Big data

Web Database

Quando furono introdotti per la prima volta i sistemi relazionali, i sostenitori dei database gerarchici (Ims) e di rete (Idms - Integrated database management systems) sostenevano che il modello relazionale fosse inferiore e non riuscisse a garantire le stesse prestazioni. Nel corso del tempo queste affermazioni si rivelarono prive di fondamento e i prodotti relazionali sono oggi la tecnologia di riferimento anche in ambienti cloud e multi-nodo (Oracle RAC ad esempio)... la storia si ripete con i big data?


Leggi articolo La questione MapReduce, di Colin White

WordCount 1.0

PseudocodeJava code
public static class MapClass extends MapReduceBase implements Mapper { private final static IntWritable one = new IntWritable(1); private Text word = new Text();
mapper (filename, file-contents):public void map(LongWritable key, Text value, OutputCollector output, Reporter reporter) throws IOException {
for each word in file-contents:String line = value.toString(); StringTokenizer itr = new StringTokenizer(line);
emit (word, 1)while (itr.hasMoreTokens()) { word.set(itr.nextToken()); output.collect(word, one); } } }
public static class Reduce extends MapReduceBase implements Reducer {
reducer (word, values): public void reduce(Text key, Iterator values, OutputCollector output, Reporter reporter) throws IOException {
sum = 0 int sum = 0;
for each value in values:while (values.hasNext()) {
sum = sum + valuesum += values.next().get(); }
emit (word, sum) output.collect(key, new IntWritable(sum)); } }