Linux 拨号vps windows公众号手机端

Spark sortByKey函数怎么使用

lewis 5年前 (2020-05-11) 阅读数 9 #大数据
文章标签 spark

sortByKey函数是Spark中的一个操作,它可以对键值对RDD中的键进行排序。

使用sortByKey函数的语法如下:

val sortedRDD = pairRDD.sortByKey([ascending: Boolean], [numPartitions: Int])

参数说明:

  • ascending:可选参数,表示是否按升序排序,默认为true。
  • numPartitions:可选参数,表示输出的RDD的分区数,默认为输入的RDD的分区数。

示例:

val rdd = sc.parallelize(List((3, "apple"), (2, "banana"), (1, "orange")))
val sortedRDD = rdd.sortByKey()
sortedRDD.foreach(println)

输出结果:

(1,orange)
(2,banana)
(3,apple)

在上面的示例中,我们创建了一个键值对RDD,然后使用sortByKey函数对键进行排序,默认按升序排序。最后通过foreach操作来打印排序后的结果。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门