首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >是否有一种不使用Hadoop来读取AWS S3文件的方法?

是否有一种不使用Hadoop来读取AWS S3文件的方法?
EN

Stack Overflow用户
提问于 2015-07-26 04:59:49
回答 1查看 2.1K关注 0票数 4

独立程序可以通过使用AWS客户端jar文件来读写AWS S3文件而不需要Hadoop。火花程序可以在没有Hadoop的情况下读写文件。然而,Spark需要读写AWS S3文件的程序才能使用Hadoop。即使如此,Spark1.4和Hadoop2.6& 2.7中仍然存在关于S3缺少Hadoop类的运行时错误,即使设置了Hadoop目录。

  1. 是否有一种方法可以让星火程序通过使用AWS客户端jar文件来读取/写入S3文件而不使用Hadoop?
  2. 如果不是,我如何在运行时解决S3中缺少Hadoop类的Spark问题?
EN

回答 1

Stack Overflow用户

发布于 2015-07-26 05:59:20

Spark使用Hadoop类来读取S3,但它不需要安装Hadoop (我们使用的是为Hadoop2.4版本预先构建的版本)。只需确保您使用s3n://前缀

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31633793

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档