数据处理

94 篇文章
31 人订阅

全部文章

用户1733462

vim正则匹配若干操作

将第一个//之间的正则表达式替换成第二个//之间的字符串。 :s/正则表达式/替换字符串/选项

511
用户1733462

shell脚本打印99乘法表

562
用户1733462

shell脚本批量添加用户

使用useradd 添加用户, passwd设置密码, 这时候有两种方式读取username.txt文件中用户名

673
用户1733462

推荐架构

755
用户1733462

object __new__函数

692
用户1733462

x轴坐标斜着显示set_xticklabels(tt.index,rotation=45)

932
用户1733462

pycharm 连接远程服务器

1143
用户1733462

pandas plot

1414
用户1733462

pandas操作一列数据

1252
用户1733462

hive sql 分区

将t2数据插入到t1,分区日期是‘2018-10-27’,使用overwrite会删除之前分区所有内容,into将内容追加到分区 注意SELECT必须在同一行...

1102
用户1733462

hive sql练习1

1952
用户1733462

hive sql练习

4152
用户1733462

关联规则挖掘算法

732
用户1733462

回归

看一下损失函数的导函数tanh(x),当x偏离0时,tanh(x)趋向+1或者-1

1052
用户1733462

Home Depot Product Search Relevance

kaggle赛题链接Home Depot Product Search Relevance,这个题目关键点就是特征提取,给的数据需要观察处理

891
用户1733462

gensim,dictionary

操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,例如tokenize,gensim词典官网,功...

1102
用户1733462

ssh免密登陆上传下载文件直接使用scp命令

在滴滴云申请了三台服务器,分别命名Master,Worker1,Worker2,用来配置spark环境,需要在本地远程免密操作三台机器,首先在本地生成RSA公私...

1391
用户1733462

提交任务到集群

1542
用户1733462

Bagging与Boosting

1113
用户1733462

split函数使用的一个小故障

1638

扫码关注云+社区