本文是在 Hadoop 伪分布式环境搭建的基础上运行的,请先安装 Hadoop 环境。
注: 文本中的代码块中的 >>>
表示的是输入的 Python 语句,其他的语句是运行后输出。
这里使用的是 pip 安装,很方便:
1 | pip install hdfs |
---|
12 |
|
---|
其他参数说明:
classhdfs.client.Client(url, root=None, proxy=None, timeout=None, session=None)
url:ip:端口
root:制定的hdfs根目录
proxy:制定登陆的用户身份
timeout:设置的超时时间
seesion:requests.Session instance, used to emit all requests.
123 |
|
---|
其他参数:status(hdfs_path, strict=True)
hdfs_path:就是hdfs路径
strict:设置为True时,如果hdfs_path路径不存在就会抛出异常,
如果设置为False,如果路径为不存在,则返回None
12 |
|
---|
其他参数:list(hdfs_path, status=False)
status:为True时,也返回子目录的状态信息,默认为Flase
123 |
|
---|
其他参数:makedirs(hdfs_path, permission=None)
permission:设置权限
123 |
|
---|
123456 |
|
---|
其他参数:delete(hdfs_path, recursive=False)
recursive:删除文件和其子目录,设置为False如果不存在,
则会抛出异常,默认为False