DuncanZhou

LV1
发表了文章

Flink学习记录

DuncanZhou
API大数据KafkaPython
发表了文章

python-MPI安装命令

Step2:sudo apt-get install openmpi-bin</br>

DuncanZhou
Pythonapt-getBashBash 指令
发表了文章

pyspark记录

1.1 spark.read.json() / spark.read.parquet() 或者 spark.read.load(path,format=”par...

DuncanZhou
sparkBashBash 指令Python
发表了文章

python构建小顶堆

DuncanZhou
编程算法
发表了文章

Redis学习

使用场景对比:set 存储单个大文本非结构化数据,hset 则存储结构化数据,一个 hash 存储一条数据,一个 filed 则存储 一条数据中的一个属性,va...

DuncanZhou
编程算法Redis
发表了文章

pip安装包更换pypi源

DuncanZhou
发表了文章

P问题/NP问题/NP-Hard问题/NP-Complete问题

DuncanZhou
发表了文章

在非root用户下安装mpi4py

安装mpi4py所需要的依赖包(python2.7版本/Cpython/Openmpi) 1.源码包安装Python2.7版本

DuncanZhou
HTMLPython
发表了文章

判断无向图是否是一颗树

DuncanZhou
数据结构Node.js
发表了文章

neo4j官方开发文档阅读记录

neo-4j由两部分组成:relationship,label和property,label或者relationship中包含property,label与la...

DuncanZhou
云推荐引擎文件存储数据加密服务
发表了文章

python与neo-4j交互(对py2neo包做的笔记)

DuncanZhou
数据结构Node.js
发表了文章

Spark笔记

基础版:https://tech.meituan.com/2016/04/29/spark-tuning-basic.html

DuncanZhou
MapReduce
发表了文章

Scala笔记

DuncanZhou
订阅了专栏

腾讯云自媒体分享计划

3 文章3.5K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.5K 关注者
发表了文章

数据挖掘整理

2.1数据清洗:填写缺失值、光滑噪声数据,识别或删除离群点,并解决不一致性来“清理”数据

DuncanZhou
其他
发表了文章

IV值和WOE值记录

1)用途:评价特征或变量的预测能力。类似的指标还有信息增益 、增益率和基尼系数等

DuncanZhou
其他
发表了文章

Hive SQL 学习

example: 一个班有学生id,成绩,班级,现在将学生根据班级按照成绩排名。(partition by)

DuncanZhou
其他
发表了文章

模型记录

用bootstrap自助法生成m个训练集,对每个训练集构造一颗决策树,在节点找特征进行分裂的时候,并不是对所有特征找到使得指标(如信息增益)最大的,而是在特征中...

DuncanZhou
其他
发表了文章

pyspark记录

1.1 spark.read.json() / spark.read.parquet() 或者 spark.read.load(path,format=”par...

DuncanZhou
其他

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券