Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >当在星火中广播数据时，会有什么缺点？

问当在星火中广播数据时，会有什么缺点？
EN

Stack Overflow用户

提问于 2019-12-19 06:00:08

回答 2查看 329关注 0票数 0

我知道，当试图最小化节点间数据的洗牌量时，广播变得非常有用。例如，在下面的代码中，我将airports_df广播到flights_df，以尽量减少联接操作期间的洗牌。

broadcast_df = flights_df.join(broadcast(airports_df), \
flights_df["Destination Airport"] == airports_df["IATA"] )

1.)现在，广播不需要在我的员工节点上增加存储空间吗？广播后的df会驻留在记忆中吗？如果它太大，不适合一个工人的记忆呢？

2.)广播会导致I/O瓶颈吗？

语音识别特惠，低至14.9元！

提供业界非常具有性价比的语音识别服务，超高识别准确率，适用多场景

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-12-19 07:40:21

回答你的问题，

现在，广播不需要在我的工作节点上增加存储空间吗？广播后的df会驻留在记忆中吗？如果它太大，不适合一个工人的记忆呢？

广播变量保存在每个工作节点的缓存内存中，不确定什么是额外存储，但它只是缓存内存，是的，我们可以说它是火花内存以外的额外内存。

如前所述，广播df驻留在工作者的缓存内存中。

在默认情况下，广播变量在内存中最多可达10 to，您可以通过spark.sql.autoBroadcastJoinThreshold参数控制它。但不确定阈值。

广播是否会造成I/O瓶颈？

当您广播一个值时，它只被复制到执行器一次。因此，在火花执行过程中不会重复调整数据集，这反过来又减少了网络I/O.

票数 0

EN

Stack Overflow用户

发布于 2019-12-19 07:00:28

当广播的df小到足以容纳内存时，您应该使用广播，如果它更小，那么您想要加入的df就会更小，因此与洗牌操作相比，您将得到更少的I/O。在默认情况下，Spark使用10 of的阈值来确定df是否是一个很好的广播候选，并且可以自己进行优化。当然，阈值是可配置的。我已经在DFs上使用了广播，当它是合理的(即另一个df是几十个GBs甚至更多)时，它会达到数十甚至数百mb。所以这一切最终都是为了取舍。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59411276

复制

相关文章

Docker部署_docker部署网站

容器镜像服务 wordpress 网站建设数据库

我们都爱用 WordPress，(几乎)一行代码都不用写，就能得到一个好看、实用的动态网站。

全栈程序员站长

2022/11/17

9150

Docker部署_docker部署网站

常用的做网站软件、网站制作软件分享

数据库网站 sql flash

网站制作中用到的软件很多，针对前端开发人员的有Dreamweaver，图片软件有Firework和photoshop，正对后端的开发软件更多，不同的开发语言用到的软件都不一样，如果您不是开发人员，只想做网站的话可以去下载网站管理系统来做，比如国内的PageAdmin系统，Discuz系统等等都是很不错的建站系统，下载下来不需要什么经验就可以自己做网站。

用户4831957

2019/10/19

7.7K0

【网站部署】解析二级域名并部署网站

数据库网站部署配置域名

解析二级域名 : 我是在阿**上申请的阿**的服务器, 响应的域名也托管到了阿**旗下的万网上, 因此在万网上解析了二级域名;

韩曙亮

2023/03/27

2.2K0

【网站部署】解析二级域名并部署网站

使用HHDESK部署网站

本篇接着这个思路，详细讲述一下网站部署，一个原本麻烦，但通过HHDESK的处理之后变得简单的工作。

恒辉信达技术有限公司

2023/07/03

1870

使用nginx部署网站

nginx 网络安全缓存 c++网站

如果服务器只需要放置一个网站程序，解析网站到服务器的网站，网站程序监听80端口就可以了。如果服务器有很多应用，借助nginx不仅可以实现端口的代理，还可以实现负载均衡。本文将详细介绍前端及nodeJS项目在服务器配置时需要用到的nginx配置。

java思维导图

2019/11/05

2.7K0

Docker-网站部署实践

网站容器镜像服务

1.网站开发完成之后进行发布，.net开发的网站可以使用dotnet命令进行发布。

kdyonly

2023/03/03

1.2K0

把网站做成软件

刚接触电脑那会，对软件的了解不如现在来的深切，那时候软件两个字在我脑海中的概念就是通过搜索引擎搜索结果或直接在浏览器地址栏中输入网址进入获取我需要的软件的网站，然后寻找下载这个软件的按扭，点击下载软件。在某些提供软件下载的网站中，这个下载按扭往往不是显而易见的容易找到，经常被其它下载莫名其妙资源的按扭干扰，需要费很大一番力气才能把需要的软件下载下来。下载下来的软件是一个几M到几G不等的安装包文件，点击打开它，然后按照界面上的安装向导指示安装完成后就能使用了。软件有各种各样的功能，能听音乐、制作图表、

用户1608022

2018/04/11

1.2K0

CentOS部署.NET Core网站

nginx .net asp.net 网络安全

https://docs.microsoft.com/zh-cn/dotnet/core/install/linux-centos

TOMD

2022/08/10

1.2K0

CentOS部署.NET Core网站

使用Fabric部署网站应用

网站 python 打包 linux

以前一直用rsync同步代码到服务器，这种山寨方法用一次两次还可，每天部署10次就麻烦了，最近抽空研究了一下Fabric，发现这个东西部署起来简直太爽了。

星哥玩云

2022/07/03

1.6K0

CentOS部署.NET Core网站

centos .net asp.net nginx 云服务器

安装 .NET 之前，请运行以下命令，将 Microsoft 包签名密钥添加到受信任密钥列表，并添加 Microsoft 包存储库。打开终端并运行以下命令：

TOMD

2022/08/01

6440

CentOS部署.NET Core网站

使用nginx部署网站教程

api nginx gzip server 反向代理

如果服务器只需要放置一个网站程序，解析网站到服务器的网站，网站程序监听80端口就可以了。如果服务器有很多应用，借助nginx不仅可以实现端口的代理，还可以实现负载均衡。本文将详细介绍前端及nodeJS项目在服务器配置时需要用到的nginx配置。

用户4283147

2022/10/27

2.1K0

GitPages部署自己的网站

git github 开源 hexo 腾讯云开发者社区

该文章主要为了记录我如何在GitPages上面部署博客网站，这里的话，码云上面也有相同的功能。若有小伙伴担心GitHub担心把中国的访问也禁了的话（大概不会吧），可以在码云上面部署。流程应该是差不多的。因为我使用的域名是.cn后缀，所以部署到GitHub上面就不用备案了。码云是国内的，应该要备案了，这个就看各位小伙伴的选择了。可以看看我的网站：

Johnson木木

2021/12/24

1.5K0

GitPages部署自己的网站

使用Fabric部署网站应用

以前一直用rsync同步代码到服务器，这种山寨方法用一次两次还可，每天部署10次就麻烦了，最近抽空研究了一下Fabric，发现这个东西部署起来简直太爽了。 Fabric是一个用Python开发的部署工具，最大特点是不用登录远程服务器，在本地运行远程命令，几行Python脚本就可以轻松部署。花10分钟写了一个部署脚本fabfile.py（名字不能变），放到工程目录下： #!/usr/bin/env python # -*- coding: utf-8 -*- from datetime import da

小小科

2018/05/02

1.1K0

【Zabbix】部署监控软件

zabbix root 部署监控软件

[root@srv-tz ~]# systemctl enable --now httpd

Xiongan-桃子

2023/06/10

6280

1分钟部署vue静态网站，借助云开发静态网站部署属于自己的网站

云开发小程序·云开发 vue.js 网站打包

这也就意味着，我们的网站可以供用户在任何地方访问。下面就来教大家如何快速的部署一个属于自己的网站。

编程小石头

2021/01/12

3.5K1

1分钟部署vue静态网站，借助云开发静态网站部署属于自己的网站

轻松部署Odoo软件

云服务器 erp 企业云市场

本文档由 Websoft9 公司提供，用于指导用户学习 Odoo 的安装部署与基本运维技术，包括：Odoo部署、初始化安装、环境配置、HTTPS、SMTP、备份升级和连接云服务器操作等基本操作。

网久软件

2021/05/29

5.1K0

使用WebDeploy部署远程IIS网站

iis https 网络安全网站

目录使用WebDeploy部署远程IIS网站后台服务部署服务器配置本地WebDeploy发布文件配置前端页面部署 WebDeploy服务端配置 WebDeploy发布文件配置

心莱科技雪雁

2019/08/20

2.9K0

使用WebDeploy部署远程IIS网站

PythonAnyWhere免费部署python类网站

在执行部署Django网站之前，应该先处理好前期工作，比如对settings.py文件进行设置以防止私密信息泄露等。本文只是简单的笔记，原文地址为：https://tutorial.djangogirls....

晓歌

2018/08/15

7.8K0

PythonAnyWhere免费部署python类网站

Apache Tomcat服务部署网站

tomcat java 网站 apache xml

Tomcat是Apache软件基金会的Jakarta项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成.由于有了Sun的参与和支持,最新的Servlet和JSP规范总是能在Tomcat中得到体现,因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web应用服务器.

微软技术分享

2022/12/28

6570

常用软件和网站

java github windows git linux

An excellent open source blog project：Halo

飞翔的竹蜻蜓

2020/07/07

1.1K0

相似问题

网站问答软件

50

网站广告软件

13

网站恶意软件

23

订阅网站软件

14

网站部署

15

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例