首页
学习
活动
专区
工具
TVP
发布

刘笑江的专栏

专栏作者
34
文章
52040
阅读量
24
订阅数
量化交易笔记
投资中面临着系统性风险(即 \beta​ )和非系统性风险(即 \alpha​ ),\alpha​ 是投资者获得与市场波动无关的回报。比如投资者获得了15%的回报,其基准获得了10%的回报,那么 \alpha​ 或者价值增值的部分就是5%。
刘笑江
2018-10-09
7560
Loss Function
常见的损失函数。 范数 损失函数中, 正则项一般是参数的 Lp 距离. L1最优化问题的解是稀疏性的, 其倾向于选择很少的一些非常大的值和很多的insignificant的小值. 而L2最优化则更多的非常少的特别大的值, 却又很多相对小的值, 但其仍然对最优化解有significant的贡献. 但从最优化问题解的平滑性来看, L1范数的最优解相对于L2范数要少, 但其往往是最优解, 而L2的解很多, 但更多的倾向于某种局部最优解. L0范数本身是特征选择的最直接最理想的方案, 但如前所述, 其不可分, 且
刘笑江
2018-06-07
1.7K0
学习协同过滤推荐 \w 100行Python代码
用一百行 Python 代码,入门协同过滤推荐。
刘笑江
2018-05-28
1.1K5
GBDT
GBDT(Gradient Boosting Descision Tree),梯度提升决策树,又名 MART(Multiple Additive Regression Tree),是由多颗回归决策树组成的 Boosting 算法,常用于 CTR 预估。本文介绍了决策树、Boosting 决策树、Gradient Boosting 决策树的算法原理和实现。 Regression Descision Tree 最小二乘回归树生成算法 输入:训练数据集 DDD 输出:回归树 算法:在训练集所在的输入空间中,递归
刘笑江
2018-05-28
9500
无约束最优化问题求解
无约束最优化问题求解方法的学习笔记 神经网络中的学习过程可以形式化为最小化损失函数问题, 该损失函数一般是由训练误差和正则项组成 损失函数的一阶偏导为 损失函数二阶偏导可以使用海塞矩阵 Hessian Matrix H\mathbf{H}H 表示, 其中每个权重向量 iii 的元素 jjj 的二阶偏导数为 一阶求解方法有 SGD Adam RMSProp 等,利用梯度(超平面)的信息求解,计算高效,收敛稍慢,需要超参数。 二阶求解方法有牛顿法,拟牛顿法,BFGS,L-BFGS 等,用二阶梯度(超曲面)
刘笑江
2018-05-28
1.7K0
Deep Learning
深度学习笔记 感知机 定义 image.png 其中, sign(x)=1 if x≥0 else 0 几何解释: w⋅x+b 是特征空间的超平面, 把特征空间划分成两部分. 损失函数 错误分类点总数, 但不是连续可导, 不容易优化 image.png 错误分类点到超平面的距离. 对于给定 x0x_0x​0​​ 到超平面的距离是 image.png 其中 ∣w∣ 是 L2范式. 那么有损失函数 image.png 其中 MMM 是错误分类点的集合 学习方法 随机梯度下降法 sto
刘笑江
2018-05-28
9480
微信读书排版引擎自动化测试
本文介绍了为解决测试的难题,如何逐步将人工测试步骤自动化,最终构建了一套微信读书排版引擎自动化测试流程。
刘笑江
2018-05-28
1.5K0
微信读书冷启动推荐实战:一种基于用户属性的方法
引言 在文章《微信读书冷启动书籍推荐初探:一个借助微信用户画像的方法 》1,我们发现用户的阅读偏好与用户属性(性别、年龄、n 线城市、公众号阅读偏好)相关。基于这个发现,我们利用用户属性,给冷启动的
刘笑江
2018-05-28
6710
Factorization Machine
Factorization Machine [1] 是一种预测模型,广泛用于推荐系统,优点有: 适用于 SVM 无法应付的稀疏数据 FM (2-way) 比 LR 多了二阶 kernel,适用于大数据,线性复杂度,可以用 primal objective 而不是 dual objective 优化(如 SVM) 通用的预测模型,适用于任何实数特征。 下面是 [1] 的学习笔记。 Factorization Machine 假设训练数据集 DD 是高度稀疏的 D=\{(\textbf x^{(1)}, y^{
刘笑江
2018-05-28
4610
Matrix Factorization
Matrix Factorization 是一种协同过滤思想的方法,用于物品推荐和评分预测。 YAHOO 团队在 Netflix Prize 应用 Matrix Factorization 并取得较好的成绩,效果远超传统协同过滤方法 [1],我们在下文详细展开介绍。 MF 可以把用户 - 物品评分矩阵分解,得到用户、物品特征矩阵: R_{u \times i} = P_{u \times k} Q_{i \times k} ^T \\ \hat r_{ui} = q_i^T p_u 其中 R 是用户
刘笑江
2018-05-28
8140
微信读书冷启动用户书籍推荐初探:一个借助微信用户画像的方法
引言 微信读书 App 中的书籍推荐系统,逐渐开始在运营活动中(每周热榜、新手卡片)使用,尝试从技术侧帮助运营侧提高转活动的化率。 对微信读书的活跃用户,我们根据其读书时长、点评书等用户行为,做书籍推荐。对微信读书新增用户,由于缺少用户行为数据,无法使用这种方法做推荐,此类问题常被称为推荐系统冷启动问题。 然而,我们发现微信用户画像,比如基础属性(年龄、城市、性别等)和公众号阅读兴趣等,与微信读书用户的阅读兴趣相关。借助微信用户画像进行书籍推荐,准确率较随机推荐提升约 1 倍。 分析建模 如何评估微信用
刘笑江
2018-05-28
1.6K0
微信读书排版引擎自动化测试方案
刘笑江
2016-09-28
4.4K4
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档