前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用java程序操作hadoop,intellij IDEA和maven的使用

用java程序操作hadoop,intellij IDEA和maven的使用

作者头像
gzq大数据
发布2022-05-11 11:42:27
4930
发布2022-05-11 11:42:27
举报
文章被收录于专栏:大数据那些事大数据那些事

如果用hadoop直接操作,还要学一些专门的hadoop指令,其实也可以用java代码来操作hadoop 首先电脑上安装intellig IDEA,notepad++,之前开启的hadoop集群(三台linux虚拟机) 首先,在windows下设置hadoop环境:

在这里插入图片描述
在这里插入图片描述

红线的两个是至关重要的文件,否则在执行java_api时会报错 接下来设置环境变量:

在这里插入图片描述
在这里插入图片描述

在path里添加路径:

在这里插入图片描述
在这里插入图片描述

并且要把hadoop.dll文件放到红圈目录下重启电脑:

在这里插入图片描述
在这里插入图片描述

接下来安装maven,我这里安装的是最新版本的maven 官网如下: http://maven.apache.org/download.cgi

在这里插入图片描述
在这里插入图片描述

安装好后,将其解压在指定目录,我放在D盘下:

在这里插入图片描述
在这里插入图片描述

这个时候要设置云镜像源,这样可以让下载速度更快,要修改settings.xml,用notepad++打开,在mirrors配置项里进行配置,并且加上jar包的仓库目录:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
     <mirror>  
      <id>alimaven</id> 
      <mirrorOf>central</mirrorOf> 
      <name>aliyun maven</name>  
      <url>http://maven.aliyun.com/nexus/content/groups/public/</url>;           
     </mirror>
  </mirrors>
代码语言:javascript
复制
  <localRepository>E:\maven\LocalWarehouse</localRepository>

下面的LocalWarehouse是自己创建的文件本地仓库 接下来设置环境变量,同上:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

现在可以打开intellji IDEA进行设置maven,创建一个maven项目(不加骨架),自己起名字,进去后点击settings:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

设置好后,导入jar包(下面这些都是要下载的对应jar包):

代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.gzq1</groupId>
    <artifactId>hadoop_api</artifactId>
    <version>1.0-SNAPSHOT</version>

    <dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.7.5</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.7.5</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.7.5</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce-client-core</artifactId>
            <version>2.7.5</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>RELEASE</version>
        </dependency>
    </dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.1</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                    <encoding>UTF-8</encoding>
                    <!--    <verbal>true</verbal>-->
                </configuration>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-shade-plugin</artifactId>
                <version>2.4.3</version>
                <executions>
                    <execution>
                        <phase>package</phase>
                        <goals>
                            <goal>shade</goal>
                        </goals>
                        <configuration>
                            <minimizeJar>true</minimizeJar>
                        </configuration>
                    </execution>
                </executions>
            </plugin>

        </plugins>
    </build>


</project>

导入后intellji IDEA会自动下载相应jar包

在这里插入图片描述
在这里插入图片描述

下载完成会显示绿色对勾 这个时候就可以在java目录下创建一个包,并且在包下创建一个类,和一个方法:

在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
package cn.gzq1.hdfs_api;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.junit.Test;

import java.io.*;


/**
 * @Auther: gzq
 * @Date: 2020/11/21 - 11 - 21 - 14:36
 * @Description: cn.gzq1.hdfs_api
 */
public class HdfsApiDemo {

    @Test
    public void getFileSystem1() throws IOException {
        Configuration configuration = new Configuration();
        
        configuration.set("fs.defaultFS", "hdfs://192.168.19.110:8020/");

        FileSystem fileSystem = FileSystem.get(configuration);
        System.out.println(fileSystem.toString());
    }
  }

检查三台虚拟机是否开启相应的hadoop服务:

在这里插入图片描述
在这里插入图片描述

另外两台就不放图了 实行后,打印成功:

在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-11-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档