首页
学习
活动
专区
工具
TVP
发布

祥子的故事

专栏作者
190
文章
333727
阅读量
40
订阅数
HIVE窗口函数
CSDN博客地址:https://mp.csdn.net/mdeditor/81067060
努力在北京混出人样
2018-07-16
1.1K0
hadoop | spark | hadoop的搭建和spark 的搭建
为了学习hadoop和spark,开始了搭建这两的心酸路。下面来介绍下我是如何搭建的,大家可以模仿下,若是有遇到问题,请留言哟。 之前搭建成功过,后来冒出问题,一直没解决掉。这次算是搞定了。 hadoop 搭建 版本hadoop-2.7.1.tar.gz,去官网下载就可以。解压到ubuntu下hadoop用户的目录下。 第一步、配置java环境 去http://www.oracle.com/technetwork/java/javase/downloads/index.html 下载合适你电脑系统
努力在北京混出人样
2018-05-14
7410
python | pandas | 移动窗口函数rolling
超级好用的移动窗口函数 最近经常使用移动窗口函数,觉得很方便,功能强大,代码简单,故将pandas中的移动窗口函数都做介绍。它都是以rolling打头的函数,后接具体的函数,来显示该移动窗口函数的功能。 rolling_count 计算各个窗口中非NA观测值的数量 函数 pandas.rolling_count(arg, window, freq=None, center=False, how=None) arg : DataFrame 或 numpy的ndarray 数组格式 window
努力在北京混出人样
2018-05-14
3.4K0
python | 工作笔记 | pandas 常用总结
之前使用pandas处理数据使用的少,最近在实习中经常用到,故自以为把心得总结一番。 说明:有部分是网上查到的案例,觉得很实用,就把它搬过来了。 ---- DataFrame的列名 concat拼接 merge 两个dataframe拼接 计算nan的个数 排序 删除重复记录 使用pandas画图中文显示问题 双坐标轴的图 enumerate函数 时间处理 时间转换为周几周月 画图 一个框中框中画多个图 多个子图 1.DataFrame的列名 ## 方法一:全部修改 df.columns = ['
努力在北京混出人样
2018-05-14
1.1K0
LeetCode | 两数之和除以10
计算两个数的和,再除以10,将上一次的上和下两个数加起来,再除以10,连续进行下去。 如: (2 -> 4 -> 3) (5 -> 6 -> 4) 输出为: 7 -> 0 -> 8 解析: (2+5)/10 余数为7,商为0 (4+6+0)/10 余数为0,商为1 (3+4+1)/10 余数为8,商为0 故:7->0->8 代码 class ListNode(object): def __init__(self, x): self.val
努力在北京混出人样
2018-05-14
6720
机器学习 | 线性回归
计划好久,还欠下的债。 问题一: 最小二乘法和梯度下降法的区别 在回答这个问题前,有必要来推导下线性回归的公式,方能说到实处。 开始公式 如一元线性回归,即只有一个自变量,那也只有两个参数w1w_{1}和w0w_{0},表达式如下: f(x)=w0+w1∗x1 f(x) = w_{0} + w_{1}*x_{1} 其损失函数为: J(w)=∑i=1N(yi−w0−w1∗xi)2 J(w) = \sum_{i=1}^{N} (y_{i} - w_{0} - w_{1}*x_{i})^{2} 改为矩阵
努力在北京混出人样
2018-05-14
6210
tensorflow | 随机数
使用tensorflow自带的随机种子函数来产生的随机数还是随机的,一脸尴尬。先介绍随机种子的使用。再来介绍随机函数。 ---- 随机种子 案例一 结果不一样 案例二 结果一样 随机函数 正态分布 截断正态分布 均匀分布 数据重排 例子 随机种子 案例一: 结果不一样 import tensorflow as tf b = tf.random_normal([1],seed = tf.set_random_seed(1234)) with tf.Session() as sees1: pri
努力在北京混出人样
2018-05-14
2K0
python | pandas 改变列的位置、填充缺失值
本期的文章源于工作中,需要固定label的位置,便于在spark模型中添加或删除特征,而不影响模型的框架或代码。 spark的jupyter下使用sql 这是我的工作环境的下情况,对你读者的情况,需要具体分析。 sql = ''' select * from tables_names -- hdfs下的表名 where 条件判断 ''' Data = DB.impala_query(sql) -- 是DataFrame格式 **注意:**DB是自己写的脚本文件 改变列的位置 前
努力在北京混出人样
2018-05-14
5.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档