数据处理

86 篇文章
30 人订阅

全部文章

用户1733462

pandas操作一列数据

612
用户1733462

hive sql 分区

将t2数据插入到t1,分区日期是‘2018-10-27’,使用overwrite会删除之前分区所有内容,into将内容追加到分区 注意SELECT必须在同一行...

682
用户1733462

hive sql练习1

1072
用户1733462

hive sql练习

1392
用户1733462

关联规则挖掘算法

582
用户1733462

回归

看一下损失函数的导函数tanh(x),当x偏离0时,tanh(x)趋向+1或者-1

652
用户1733462

Home Depot Product Search Relevance

kaggle赛题链接Home Depot Product Search Relevance,这个题目关键点就是特征提取,给的数据需要观察处理

761
用户1733462

gensim,dictionary

操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,例如tokenize,gensim词典官网,功...

812
用户1733462

ssh免密登陆上传下载文件直接使用scp命令

在滴滴云申请了三台服务器,分别命名Master,Worker1,Worker2,用来配置spark环境,需要在本地远程免密操作三台机器,首先在本地生成RSA公私...

911
用户1733462

提交任务到集群

1402
用户1733462

Bagging与Boosting

1023
用户1733462

split函数使用的一个小故障

1468
用户1733462

236. Lowest Common Ancestor of a Binary Tree

2104
用户1733462

236. Lowest Common Ancestor of a Binary Tree

1425
用户1733462

149. Max Points on a Line - 草稿

1152
用户1733462

人大代表数据分析爬取代表数据正则表达式提取需要的数据还可以把上面数据画成饼图民族词云图统计代表姓氏人数姓氏词云

2163
用户1733462

leetcode222求完全二叉树节点个数

3014
用户1733462

最大似然函数最大似然原理小结:最大似然估计法的一般步骤:例子:

1.1K2
用户1733462

如何快速抄写公众号文章

1496
用户1733462

python命名中下划线的含义

1252

扫码关注云+社区