首页
学习
活动
专区
工具
TVP
发布

成长道路

专栏作者
31
文章
50483
阅读量
36
订阅数
apache griffin本地安装部署
1.下载到本地github地址:https://github.com/apache/griffin
用户1171305
2019-07-02
2.6K0
selenium使用webdriver,打开浏览器
from selenium import webdriver import time driver=webdriver.Chrome() driver.maximize_window() time.sleep(5) driver.get("https://www.baidu.com/")
用户1171305
2019-07-02
1.4K0
shell定时执行
删除test1.sh的任务 sed -i '/test1.sh/d' /var/spool/cron/root 删除文件中含有test1.sh的行
用户1171305
2019-07-02
1.5K0
oozie action参数传递
File file = new File(System.getProperty("oozie.action.output.properties"));
用户1171305
2019-07-02
1.9K0
kettle环境搭建
1.github上面kettle的源码下载地址:https://github.com/pentaho/pentaho-kettle
用户1171305
2019-07-02
1.8K0
通过oozieClient获取指定jobid工作流的状态信息以及节点的状态信息
<dependency> <groupId>org.apache.oozie</groupId> <artifactId>oozie-client</artifactId> <version>4.3.1</version> </dependency>
用户1171305
2019-07-02
8470
Eclipse将引用了第三方jar包的Java项目打包成jar文件的两种方法
原文转载自:http://www.cnblogs.com/lanxuezaipiao/p/3291641.html
用户1171305
2019-05-26
1.7K0
表格展示+多余数据省略+鼠标悬浮显示
该文介绍了如何在前端实现表格的根据内容自适应高度及鼠标悬浮显示标题栏。首先,需要给表格的td,th设置一些样式,包括居中显示、垂直居中显示、文本不换行、文本省略号显示等。然后,给表格设置固定的表格布局,以便让表格的列宽自适应内容。最后,给表格的省略的单元格加上标题,一般使用数据库获取到的原始数据。
用户1171305
2017-12-28
2.3K0
spark提交任务,参数的形式是JSON
spark提交任务,参数的形式是JSON 比如:spark2-submit --class com.iflytek.test.Jcseg_HiveDemo  spark_hive.jar  {"tab
用户1171305
2017-12-28
1.4K0
mako模板+django+分页
遇到的问题:我看网上html页面大家通过page2.next_page_number和page2.preivous_page_number获取上一页和下一页的页码,而我在mako页面获取到的是一串很长
用户1171305
2017-12-28
6990
org.apache.spark.sql.AnalysisException: Table or view not found: `traintext`.`train`; line 1 pos 14;
该文介绍了如何使用Spark SQL读取Hive表中数据的方法。首先介绍了Spark SQL的基本概述,然后给出了一个示例代码,展示了如何读取Hive中的数据。在代码中,使用了Spark SQL的DataFrame API和SQL查询来读取数据。最后,给出了在代码中使用Hive配置文件的示例。
用户1171305
2017-12-28
5.5K0
hive脚本的三种执行方式
1.hive控制台执行,安装了hive之后直接命令行输入hive,进入控制台。 2.hive -e "sql语句",直接输入就会有结果,sql语句根据具体情况自己书写 3.hive -f a.sql
用户1171305
2017-12-28
1.9K0
hive基本概念
用户1171305
2017-12-28
8080
用oozie命令行的方式在yarn上运行spark任务
本文介绍了如何使用oozie命令行的方式在yarn上运行spark任务,包括准备环境、上传jar包、配置job.properties和workflow.xml文件、执行命令、查看oozie和yarn的界面、查看yarn的日志文件等步骤。
用户1171305
2017-12-28
2.2K0
OneHotEncoder介绍单属性多属性scala实现
       因为项目的需要,将数据库中表的属性向量化,然后进行机器学习,所以去spark官网学习了一下OneHotEncoder,官网的相关介绍比较少,主要是针对单属性的处理,但是项目的要求是多属性
用户1171305
2017-12-28
9720
Word2Vec
本文介绍了如何使用Spark 2.0处理文本数据,通过Word2Vec将文本转为向量,并利用聚类、分类和回归算法进行文本分析。实验结果表明,Word2Vec对文本向量化效果良好,聚类和分类算法可以有效地对文本进行分类。
用户1171305
2017-12-28
1K0
Jcseg分词器的实现详解
本文介绍了如何使用基于Java的jieba分词库和HanLP中文分词库进行中文分词。首先介绍了jieba分词库的使用方法,包括安装、配置和分词。然后介绍了HanLP分词库的使用方法,包括下载、安装、配置和分词。最后通过一个具体的示例展示了如何使用这两种分词库进行中文分词,并对结果进行了展示和解释。
用户1171305
2017-12-28
1.4K0
文本型数据的向量化:TF-IDF
本文介绍了如何使用TF-IDF将文本型数据向量化,并使用PCA降维,最后使用Spark MLlib的IDFV方法进行分类。首先,使用TF-IDF将文本转换为数值向量,然后使用PCA降维,最后将向量输入到IDFV算法中进行分类。
用户1171305
2017-12-28
1.7K0
scala的maven项目读取配置文件
用户1171305
2017-12-28
2.9K0
降维:主成分分析(PCA)
本文主要介绍了一种在技术社区中,基于用户行为,自动为用户推荐相关技术内容的算法。该算法通过分析用户的行为数据,挖掘用户的技术偏好,从而为用户推荐精准、高质量的技术内容。同时,该算法还可以不断自我学习,不断优化推荐效果。
用户1171305
2017-12-28
7330
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档