程序员的痛苦人生 2016-02-19
Mongodb可以实现MapReduce,用于完成count,distinct,group by等聚合函数的功能,此外还有其他功能。
MapReduce开始是将操作映射到mongodb集合中的每一个文档,这个操作要么什么都不做,要么产生一些键和N个值,然后按照键分组,将相同键对应值的值组成列表,放到对应的键的值中。最后进行化简,把键对应的列表中的值化简成一个单一的值。这个值被返回,接着进行洗牌,直到每个键的列表只有一个值为止,这个值也就是最后结果。
mongodb中map函数通过emit返回要处理的值。
例如:
map = function(){
for(var key in this){
emit(key,{count:1});
}
}
this就是当前映射文档的引用。
reduce = function(key,emits){
total = 0;
for(var i in emits){
total += emits[i].count;
}
return {"count":total}
}
上述示例实现了常见的wordcount
调用如下:
mr = db.runCommand({"mapreduce":"foo","map":map,"reduce":reduce})