问是否有一种不使用Hadoop来读取AWS S3文件的方法？
EN

Stack Overflow用户

提问于 2015-07-26 04:59:49

回答 1查看 2.1K关注 0票数 4

独立程序可以通过使用AWS客户端jar文件来读写AWS S3文件而不需要Hadoop。火花程序可以在没有Hadoop的情况下读写文件。然而，Spark需要读写AWS S3文件的程序才能使用Hadoop。即使如此，Spark1.4和Hadoop2.6& 2.7中仍然存在关于S3缺少Hadoop类的运行时错误，即使设置了Hadoop目录。

是否有一种方法可以让星火程序通过使用AWS客户端jar文件来读取/写入S3文件而不使用Hadoop？
如果不是，我如何在运行时解决S3中缺少Hadoop类的Spark问题？

hadoop

amazon-s3

apache-spark

回答 1

Stack Overflow用户

发布于 2015-07-26 05:59:20

Spark使用Hadoop类来读取S3，但它不需要安装Hadoop (我们使用的是为Hadoop2.4版本预先构建的版本)。只需确保您使用s3n://前缀

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31633793

复制

相似问题

问是否有一种不使用Hadoop来读取AWS S3文件的方法？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有一种不使用Hadoop来读取AWS S3文件的方法？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有一种不使用Hadoop来读取AWS S3文件的方法？
EN