首页
学习
活动
专区
工具
TVP
发布

机器学习和数学

专栏作者
68
文章
98936
阅读量
31
订阅数
Hadoop2.7+Spark2.4.0+scala2.12.12+pyspark伪分布式环境搭建
export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_261
用户1622570
2020-09-10
1K0
自然语言处理 | 使用Spacy 进行自然语言处理(二)
上次我们简单介绍了Spacy,学习了它的安装以及实体识别等基本的方法。今天我继续给大家介绍一下它的其他功能如何操作,主要有词性还原,词性标注,名词块识别,依存分析等内容。废话不多说,直接看代码。
用户1622570
2018-09-14
2.1K0
自然语言处理 | 使用Spacy 进行自然语言处理
Spacy的github地址:https://github.com/explosion/spaCy
用户1622570
2018-09-14
6.9K1
[编程经验] Python中使用selenium进行动态爬虫
Hello,大家好!停更了这么久,中间发生了很多事情,我的心情也发生了很大的变化,看着每天在增长的粉丝,实在不想就这么放弃了,所以以后我会尽量保持在一周一篇的进度,与大家分享我的学习点滴,希望大家可以继续支持我,我会努力滴!
用户1622570
2018-09-14
3.8K1
Newton迭代法
今天和大家分享一下,之前抽空写的一篇论文,主要内容就是Newton迭代法,属于数学里面比较基础的,原理也不难,主要通过Newton迭代法可以体会到迭代的思想,以及牛顿的伟大!
用户1622570
2018-07-26
6760
[机器学习] 用KNN识别MNIST手写字符实战
Hi, 好久不见,粉丝涨了不少,我要再不更新,估计要掉粉了,今天有时间把最近做的一些工作做个总结,我用KNN来识别MNIST手写字符,主要是代码部分,全部纯手写,没有借助机器学习的框架,希望对大家理解KNN有帮助。
用户1622570
2018-07-26
2.1K0
[情人节] jieba分词介绍
jieba 分词我觉得是Python中文分词工具中最好用的一个工具包。想要入门自然语言处理,jieba分词有必要好好掌握一下,今天带大家入门一下jieba分词包。 首先简单介绍一下jieba分词的原理,jieba分词采用的是基于统计的分词方法,首先给定大量已经分好词的文本,利用机器学习的方法,学习分词规律,然后保存训练好的模型,从而实现对新的文本的分词。主要的统计模型有:N元文法模型N-gram,隐马尔可夫模型HMM,最大熵模型ME,条件随机场模型CRF等。 jieba分词包含三个主要的类,分别是jie
用户1622570
2018-04-12
1.9K0
[机智的机器在学习] 机器学习中的归一化和正则化问题
今天我们要说的是,在机器学习常用的算法里面,那些需要归一化,那些不需要,通过scikit-learn中的预处理的一些方法,实际了解如何正则化和归一化数据。看完本文,应该对于一般的机器学习任务,都可以轻松上手操作。 先看一下归一化是什么意思,对于一个机器学习任务来说,首先要有数据,数据怎么来?一种情况是别人整理好给你,一种是自己造数据,根据不同的业务场景,自己提取想要的数据,一般来自各个维度的数据,也就是常说的统计口径不一样,造成的结果是得到的数据大小范围变换非常大,并且可能数据类型也不一样,统计学里面把
用户1622570
2018-04-12
2.1K0
[机器的机器在学习] 你有一次国庆节大作业待接收~
明天就国庆放假了,正好赶上中秋节,首先祝大家“双节”快乐! 不管是出去玩,还在一个人在家里,在宿舍,在自己的小房子“玩”,祝大家都能找到自己的乐趣!但是呢, 安全第一! 想乘着国庆好好学习一把的童鞋, 也别太拼, 学习一会儿就休息一下。然后我想说,我国庆要出去“嗨”一下了,so 这期间不能更新了。。 ============================== 好,接下来我们聊一下机器学习中的一个基本概念,混淆矩阵,confusion matrix,第一个听说混淆矩阵的时候,稀里糊涂的看不懂,等到我明白了机
用户1622570
2018-04-12
6450
[深度学习] AlexNet,GoogLeNet,VGG,ResNet简化版
总结了一下这几个网络的比较重要的点,像这些经典的网络,面试的时候,估计会经常问到,怎么用自己的话说出来?不知道大家想过没有。 今天有空就总结了一下,尽量简单和通俗,希望对大家有帮助。同时欢迎大家补充!谢谢! AlexNet AlexNet共有9层,包括输入层,5个卷积层和3个全连接层,中间使用了3次最大值池化。卷积核的大小由11x11到5x5再到3x3, 最后输出层是1000维的SoftMax多分类。第2,4,5和三个全连接层神经元的偏置初始化为常数1,其它层初始化为0。为了避免过拟合,AlexNet使用数
用户1622570
2018-04-12
1.6K0
Github,Gitlab简介及Git入门
刚搬了家,房子还没有网,这篇文章是开着热点写的,求赞求赞。哈哈哈 如果到现在为止,你还没听过Git,或者用过Git,那建议尽早学习一下,因为很有用。虽然是做算法的,但是编程还是必不可少的。话说在1年前,这三个我确实没用过,也没听过,后来知道了Github,在到现在知道了Gitlab,而且每天都要用Git来管理项目的代码。(主要是merge老大的代码,哭)。下面开始介绍,也许我表达的不够专业哈,但是你能听懂就行。 好,我先说下Github,Github是一个提供代码托管服务的网站,就是你可以把你的代码放在他哪
用户1622570
2018-04-12
1K0
[深度学习] 我理解的循环神经网络RNN
本来今天在写毕业论文,就不打算更新了,但是写毕业论文挺痛苦的,因为我发现毕业论文的文字不能像公众号这样比较随意,随意的文字不是说不严谨,而是为了便于大家理解,这里就是想吐槽一下,国内写论文的“八股文”现状,反正大家都是一个抄一个的,真的想搞个深度学习模型,把国内的中文论文按照写作风格做个分类,估计最多只能分两类吧,猜猜是那两类? 说到循环神经网络,其实我印象是比较深的,因为循环神经网络是我接触的第一个深度学习模型,大概在一年半前吧,那时候我还没有深度学习的概念,算是刚入门机器学习。偶然一个机会,听某位老师给
用户1622570
2018-04-12
1.1K0
[数据结构与算法] Python实现二分查找
可能有人会问,学习机器学习还要不要学习数据结构,知乎上有个帖子,对这个问题有很多讨论,但是答案基本都是一致的,要学!但是这块其实我掌握的并不好,本科的数据结构就没学好,后来就没学了,直到去年有段时间打算恶补一下,买了《数据结构和算法 python语言实现》,书写的挺好的,就是看着头疼,基本概念可以看懂,就是实现起来不是很明白。然后后来就去实习了,在公司做的是深度学习的东西,根本用不到,所以好久不看就又忘记了,唉,也是醉了。最近各大互联网公司都开始秋招了,如果是做算法方向的,基本笔试题都会涉及数据结构,我参加
用户1622570
2018-04-12
8530
[数据结构与算法] 线性表总结
线性表也是基本的数据结构之一,Python里面的list和tuple,就是线性表的一种实现。 首先什么是表呢,其实很简单,比如【元素1,元素2,。。。,元素n】,这样的一种数据的组织方式就是表,一个表里可以包含0个或者多个元素,只有0个元素的表,叫做空表。1,2,。。。,n叫做下标,元素的个数叫做表的长度。表元素之间的关系叫做下一个关系,比如元素2是元素1的下一个元素,这是一种顺序关系。 前驱元素和后继元素 在一个表中,存在唯一一个首元素和尾元素。就是元素1和元素n,除了元素1以外,每个元素都有唯一一个前驱
用户1622570
2018-04-12
8520
[数据结构与算法] 链接表总结
上一次说到了顺序表,链接表和顺序表一样,也是线性表。那为什么有了线性表还要有链接表呢?总之就是当数据过大时,顺序表存在一些存储方面的限制,而链接表比顺序表要更有效。链接表的主要不同之处在于使用了链接技
用户1622570
2018-04-12
8790
[数据结构与算法] 链表的其他类型
单链表是最简单的链表,单链表的一种变形就是循环单链表,其中最后一个结点的next域不用None,而是指向表的第一个结点,这样就形成了一种循环结构,所以叫循环单链表。 双链表:单链表只有1个方向的链接,只能做一个方向的扫描和逐步操作。单链表的next指针域指向下一个结点,而双链表结点除了具有next指针外,还有一个previous指针,指向上一个结点。单链表中查找元素只能从头结点开始,根据他的next指针域找到下一个结点,而双链表最大的区别在于不仅能找到下一个结点,还能找到上一个结点。 循环双链表:然后看下什
用户1622570
2018-04-12
8400
[算法与数据结构] 《算法导论》堆排序笔记
堆排序的实现是靠叫做“堆”的数据结构来实现的。所以学习堆排序,首先要了解什么是堆 堆 堆是一个数组,每个结点表示数组中的一个元素,堆可以看做是一个近似的完全二叉树。完全二叉树是所有叶结点深度相同,且所有内部结点度为2的2叉树。 树的高度:从结点x向下到某个叶结点最长简单路径中边的条数 表示堆的数组A包括两个属性:A.length给出数组元素的个数,A.heap-size表示有多少个堆元素存储在该数组中。 最大堆和最小堆 最大堆:除了根以外的所有结点i都要满足 A[PARENT(i)] >= A[i] 意思是
用户1622570
2018-04-12
8150
[数据结构和算法]《算法导论》动态规划笔记(2)
上一次介绍了动态规划解决钢条切割问题,这次介绍一下动态规划的原理,什么样的最优化问题适合用动态规划解决? 具有的两个基本特征:最优子结构和子问题重叠。 最优子结构 如果一个问题的最优解包含其子问题的最优解,称此问题具有最优子结构性质。 最优子结构发现过程: 证明问题最优解的第一个组成部分是做出一个选择。 对于一个给定问题,在其可能的第一步选择中,假定已经知道那种选择才会得到最优解。 给定可获得最优解的选择后,你确定这次选择会产生哪些子问题,以及如何最好地刻画子问题空间。 利用“剪切-粘贴”的技术证明:作为构
用户1622570
2018-04-12
6370
[数据结构和算法]《算法导论》动态规划笔记(1)
动态规划是求解最优化问题的方法,这类问题有很多可行解,每个解都有一个值,我们希望寻找具有最优值的解。我们称这个解为问题的一个最优解,而不是最优解,因为可能有多个解都达到最优值。 钢条切割问题 Serl
用户1622570
2018-04-12
7800
[有意思的数学]极小极大问题与博弈论入门
为啥要提到这个问题呢,是因为最近一直在做生成对抗网络(GAN)的工作,GAN的灵感来源于博弈论(也叫对策论,竞赛论)中的零和博弈,而原始GAN的优化目标又是一个极小化极大问题,所以我觉得有必要深入了解一下这个问题。另外,我觉得博弈论这个东西挺有意思的,而且挺实用的(坏笑脸),所以就查了一些资料,在这里做个总结,拿出来和大家分享。 博弈的意思其实比较简单,就是两个人,或者多个人之间的竞争,比赛。通过采取不同措施,达到不同的目的,使得自己的利益最大化。古老的故事“田忌赛马”就是博弈思想的体现,我就在想为啥田忌没
用户1622570
2018-04-12
4K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档