成长道路

31 篇文章
36 人订阅

全部文章

用户1171305

apache griffin本地安装部署

1.下载到本地github地址:https://github.com/apache/griffin

2033
用户1171305

selenium使用webdriver,打开浏览器

from selenium import webdriver import time driver=webdriver.Chrome() driver.m...

1153
用户1171305

shell定时执行

删除test1.sh的任务 sed -i '/test1.sh/d' /var/spool/cron/root 删除文件中含有test1.sh的行

1126
用户1171305

oozie action参数传递

File file = new File(System.getProperty("oozie.action.output.properties"));

1082
用户1171305

kettle环境搭建

1.github上面kettle的源码下载地址:https://github.com/pentaho/pentaho-kettle

1346
用户1171305

通过oozieClient获取指定jobid工作流的状态信息以及节点的状态信息

<dependency> <groupId>org.apache.oozie</groupId> <arti...

1004
用户1171305

Eclipse将引用了第三方jar包的Java项目打包成jar文件的两种方法

原文转载自:http://www.cnblogs.com/lanxuezaipiao/p/3291641.html

1112
用户1171305

表格展示+多余数据省略+鼠标悬浮显示

本人非专业前端,写的不好还望多多指教 1.首先需要将需要这样处理的td,th设置一下样式     text-align: center; /*设置水平居中*/ ...

2680
用户1171305

spark提交任务,参数的形式是JSON

spark提交任务,参数的形式是JSON 比如:spark2-submit --class com.iflytek.test.Jcseg_HiveDemo  s...

2220
用户1171305

mako模板+django+分页

遇到的问题:我看网上html页面大家通过page2.next_page_number和page2.preivous_page_number获取上一页和下一页的页...

2340
用户1171305

org.apache.spark.sql.AnalysisException: Table or view not found: `traintext`.`train`; line 1 pos 14;

恭喜老铁,跟我遇到了一样的问题,接下来是解决方法: 遇到的问题: org.apache.spark.sql.AnalysisException: Table o...

1.4K0
用户1171305

hive脚本的三种执行方式

1.hive控制台执行,安装了hive之后直接命令行输入hive,进入控制台。 ? 2.hive -e "sql语句",直接输入就会有结果,sql语句根据具体情...

2970
用户1171305

hive基本概念

1.hive是一个基于hadoop之上的一个数据仓库。可以处理的数据是关系型数据 库(结构性)、本地数据、hdfs数据(非结构化的数据); 2.hive是对...

2500
用户1171305

用oozie命令行的方式在yarn上运行spark任务

注意:杀死yarn进程的命令 yarn application -kill applicationID 1.做这个实验之前你的服务器上最好装了cdh集群,以及添...

3690
用户1171305

OneHotEncoder介绍单属性多属性scala实现

       因为项目的需要,将数据库中表的属性向量化,然后进行机器学习,所以去spark官网学习了一下OneHotEncoder,官网的相关介绍比较少,主要是...

2850
用户1171305

Word2Vec

       以前对于文本类型的数据,都是通过tf-idf进行处理的,这个可以参见以前写的博客,这里就不在详细介绍了。最近项目组老大跟我说了word2vec这种...

3270
用户1171305

Jcseg分词器的实现详解

1.之前的项目一直都是用的ik分词器,但是最近的一个项目项目大佬说ik好像很长时间都没更新,版本太老旧,故而用了新的jcseg的分词器,于是也上网找了一些资料,...

3130
用户1171305

文本型数据的向量化:TF-IDF

1.对于文本型数据的分类处理(或者其他的处理),根据ik和jcseg等分词器先对它们进行分词处理之后,大家都知道,计算机是处理不了汉字的,对于文本型的词我们如何...

2950
用户1171305

scala的maven项目读取配置文件

scala的maven项目读取src/main/resources目录下的资源文件该如何读取呢? 下面提供一种默认的和一种自定义的: ? 对于applicati...

4740
用户1171305

降维:主成分分析(PCA)

定义:可以将特征向量投影到低维空间,实现对特征向量的降维 步骤: 1.数据预处理。这里预处理包含俩个部分:均值归一化和属性范围调整。均值归一化是相应属性减去平均...

2610

扫码关注云+社区

领取腾讯云代金券