Spark中的广义MapReduce是什么

lewis 2016-11-18 24次阅读

在Spark中，广义的MapReduce是指使用Map和Reduce操作以及其他数据处理操作来进行分布式数据处理的一种模型。与传统的MapReduce模型不同，Spark中的广义MapReduce可以包含更多的操作，例如filter、groupByKey、reduceByKey等，同时也支持更多的数据结构，例如RDD、DataFrame和Dataset。通过使用Spark中的广义MapReduce模型，用户可以更灵活地进行数据处理并实现更复杂的分布式计算任务。