首页
学习
活动
专区
工具
TVP
发布

xingoo, 一个梦想做发明家的程序员

专栏作者
805
文章
899118
阅读量
80
订阅数
在Java Web中使用Spark MLlib训练的模型
模型下载到本地,重新命名为xml。 可以看到默认四个特征分别叫做feild_0,field_1...目标为target
用户1154259
2018-12-13
1.4K0
程序猿的日常——工作中常用的Shell脚本
如果目录下的文件很多,无法直接rm -rf,那么可以寻找一些匹配模型,分批删除。比如文件下面有很多的文件:
用户1154259
2018-10-12
5430
《美团机器学习实践》—— 读后总结
第一章 问题建模
用户1154259
2018-10-10
8680
python项目实现配置统一管理的方法
一个比较大的项目总是会涉及到很多的参数,最好的方法就是在一个地方统一管理这些参数。最近看了不少的python项目,总结了两种很有意思的配置管理方法。
用户1154259
2018-09-21
1.5K0
我的AI之路 —— OCR文字识别快速体验版
还记得前一阵某小盆友拿过来一个全是图片的ppt,让我把里面的文字给抠出来(我当时很震惊!!!),随后在网上随便找了个OCR的在线文档转换软件,就给转过来了——这里面用到的技术就是OCR文字识别,所以本篇就带大家宏观上了解一下文字识别的技术方案与实现过程。
用户1154259
2018-08-20
4K0
吴恩达机器学习笔记 —— 13 支持向量机
总结来说:如果y=1,我们希望z的值大于等于1,如果y=0,我们希望z的值小于-1,这样损失函数的值都会为0.
用户1154259
2018-08-09
6040
吴恩达机器学习笔记 —— 16 异常点检测
我感觉这篇整理的很好很用心,可以详细参考: https://blog.csdn.net/Snail_Moved_Slowly/article/details/78826088
用户1154259
2018-08-09
3760
Structured Streaming教程(2) —— 常用输入与输出
Structured Streaming 提供了几种数据源的类型,可以方便的构造Steaming的DataFrame。默认提供下面几种类型:
用户1154259
2018-07-31
1.3K0
Spring Boot切换为APR模式
Spring Boot内置了tomcat容器,直接运行Application就可以启动web服务器。
用户1154259
2018-07-31
2K0
Structured Streaming教程(3) —— 与Kafka的集成
读取的时候,可以读取某个topic,也可以读取多个topic,还可以指定topic的通配符形式:
用户1154259
2018-07-31
1.4K0
git如何忽略已经加入版本控制的文件
有时候新增一个文件,会自动追加到git的版本控制当中,但是又不想提交到仓库。可以按照下面的步骤:
用户1154259
2018-07-31
7950
Spark MLlib 之 Vector向量深入浅出
local vector是一种索引是0开始的整数、内容为double类型,存储在单机上的向量。MLlib支持两种矩阵,dense密集型和sparse稀疏型。一个dense类型的向量背后其实就是一个数组,而sparse向量背后则是两个并行数组——索引数组和值数组。比如向量(1.0, 0.0, 3.0)既可以用密集型向量表示为[1.0, 0.0, 3.0],也可以用稀疏型向量表示为(3, [0,2],[1.0,3.0]),其中3是数组的大小。
用户1154259
2018-07-31
1.9K0
Spark MLlib特征处理 之 StringIndexer、IndexToString使用说明以及源码剖析
StringIndexer可以把字符串的列按照出现频率进行排序,出现次数最高的对应的Index为0。比如下面的列表进行StringIndexer
用户1154259
2018-07-31
2.7K0
Spark MLlib 之 aggregate和treeAggregate从原理到应用
由于treeAggregate是在aggregate基础上的优化版本,因此先来看看aggregate是什么.
用户1154259
2018-07-31
8260
吴恩达机器学习笔记 —— 1 绪论:初识机器学习
1 机器学习一些比较难以变成的能力——Arthur Samuel 2 通过给定任务T以及性能度量P以及经验E,计算机程序从经验E中学习,用学习的结果改善性能P,从而实现自我完善,则称改程序具有学习能力。
用户1154259
2018-07-31
3220
吴恩达机器学习笔记 —— 2 单变量线性回归
机器学习的过程就是通过上面的例子学习一个模型,当再次有数据x进来的时候,能给出对应的y值
用户1154259
2018-07-31
3430
吴恩达机器学习笔记 —— 5 多变量线性回归
有时候特征各个维度是不同规模的,比如房间的平米数和房间数,两个数量级相差很大。如果不丛任何处理,可能导致梯度优化时的震荡。
用户1154259
2018-07-31
3300
吴恩达机器学习笔记 —— 8 正则化
在训练过程中,在训练集中有时效果比较差,我们叫做欠拟合;有时候效果过于完美,在测试集上效果很差,我们叫做过拟合。因为欠拟合和过拟合都不能良好的反应一个模型应用新样本的能力,因此需要找到办法解决这个问题。
用户1154259
2018-07-31
2520
吴恩达机器学习笔记 —— 11 应用机器学习的建议
如果已经创建好了一个机器学习的模型,当我们训练之后发现还存在很大的误差,下一步应该做什么呢?通常能想到的是:
用户1154259
2018-07-31
3650
Angular2入门体验
好的工具往往使得开发应用更快更简单,而不是任何模块都手动开发。angualr cli就是一个支持 创建工程,添加文件,对各种任务如测试、打包、部署等迭代。 本文的目的就是基于TypeScript开发构建一个angualr应用,使用angualr cli可以选择工程的风格。 在本章的 末尾,你可以理解CLI的开发以及开发完整应用的样例。 也可以通过这个链接直接下载源码。 第一步,配置环境变量 在开始开发前,需要安装nodejs。 点击这个网址,Nodejs安装文件下载 在命令行中,执行: sudo npm i
用户1154259
2018-04-17
1.6K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档