,指的是在使用R编程语言进行大规模数据处理时,将数据集分成若干个小块进行分布式运算,以提高处理效率和降低资源消耗的方法。
概念: 在大型数据集中单独运行是指将数据集分解成小块,分布式地在多个计算节点上同时运行R代码,每个节点独立处理自己负责的数据块,最后将结果进行合并。
分类: 在带有R的大型数据集中单独运行可以分为两种常见的方式:基于集群的分布式计算和基于云计算平台的分布式计算。
优势:
应用场景: 在带有R的大型数据集中单独运行常用于以下场景:
推荐的腾讯云相关产品和产品介绍链接地址:
云+社区沙龙online第5期[架构演进]
云+社区沙龙online[数据工匠]
云+社区技术沙龙[第17期]
企业创新在线学堂
云+社区开发者大会 长沙站
云+社区技术沙龙[第14期]
DBTalk技术分享会
小程序云开发官方直播课(应用开发实战)
云+未来峰会
DB・洞见
领取专属 10元无门槛券
手把手带您无忧上云