Linux 拨号vps windows公众号手机端

Spark中的广播变量是什么

lewis 5年前 (2020-01-21) 阅读数 7 #网络运维
文章标签 spark

广播变量是一种分布式共享变量,用于在集群中的所有节点上保持一份只读的变量副本。这样可以在所有节点上使用同一个变量,避免在每个任务中都复制一份变量的开销,提高性能并减少内存占用。广播变量在Spark中是只读的,一旦广播变量被创建后,它的值就不能被修改。广播变量通常用于将较大的数据集或模型参数广播到所有节点上,以便在计算过程中使用。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门