JasonhavenDai

24 篇文章
23 人订阅

全部文章

JasonhavenDai

统计学习方法之线性回归法1.线性回归2.损失函数(Cost Function)3.梯度下降4.最小二乘法5.数据归一化6. 模型评估7.参考文献

1.线性回归 回归,统计学术语,表示变量之间的某种数量依存关系,并由此引出回归方程,回归系数。 线性回归(Linear Regression),数理统计中回...

3258
JasonhavenDai

快速学会LATEX数学符号和公式1.概念2.空白距离3.特殊字符$ % ^ & _ { } ~ \4. 数学公式5.参考

1.概念 LATEX 源文件的格式为普通的 ASCII 文件,你可以使用任何文本编辑器来创建。LATEX 源文件不仅包括你所要排版的文本,还包括 LATEX...

3448
JasonhavenDai

朴素贝叶斯练习实例

文本分类:过滤恶意留言 此处有两个改进的地方: (1)若有的类别没有出现,其概率就是0,会十分影响分类器的性能。所以采取各类别默认1次累加,总类别(两类)次...

3835
JasonhavenDai

统计学习方法之感知机1.感知机模型2.学习策略3.学习算法4.源代码

1.感知机模型 在机器学习中,感知机(perceptron)是二分类的线性分类模型,属于监督学习算法。输入为实例的特征向量,输出为实例的类别(取+1和-1)。感...

3475
JasonhavenDai

统计学习方法之K近邻法1.k近邻法(k-nearest neighbor,k-NN)2.k近邻模型3.k近邻算法的实现

1.k近邻法(k-nearest neighbor,k-NN) k近邻算法是一个基本分类和回归方法,k-NN的输入时实例的特征向量,对应于特征空间的点,输出是...

2835
JasonhavenDai

统计学习方法之概论1.基础概念2.统计学习三要素3.模型评估与模型选择、正则化和交叉验证4.分类问题、标注问题、回归问题5.学习小结

1.基础概念 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科,是一门概率论、统...

2833
JasonhavenDai

论文相关知识1.核心期刊2. A、B、C类3.相关概念4.阅读方法5.参考阅读

1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science ...

3195
JasonhavenDai

统计学习方法之朴素贝叶斯1.概述2.基础知识3.基本方法4.参数估计5.简单实现

1.概述 朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验概率计...

3858
JasonhavenDai

自然语言处理绪论1.词法分析歧义2.两类不同的语言处理模型3.评测技术4.图灵实验5.学习姿势

1.词法分析歧义 自然语言处理中的歧义 分词歧义,作为自然语言处理的第一个步骤。 词性标注 语法分析歧义 ...

2968
JasonhavenDai

Docker初尝试1.What is Docker?2.Try It3.Use It

1.What is Docker? 关于Docker,网上有很多讲解,不在此处赘述,提供两个不错的学习链接,望自行学习。 Docker Github Do...

2715
JasonhavenDai

使用EndNote管理文献1.EndNote2.下载安装3.登录客户端4.同步EndNote Web5.关联Micrasoft Word

1.EndNote 官网 知乎 2.下载安装 链接 3.登录客户端 选项->首选项->同步(Sync) ? 具体的EndNote使用方法,网上有很多,...

32010
JasonhavenDai

搭建Visual Studio Code+Python开发环境1.对象简介2. 搭建步骤3.小结

1.对象简介 此次介绍的对象是Visual Studio Code。什么是Visual Studio Code呢? Visual Studio Code是一个...

3359
JasonhavenDai

自然语言处理概论1.NLP相关学科2.相关术语3.知识内容4.发展概况5.中文特征6.中文语言处理发展的主要困难7.基础理论8.主要应用

1.NLP相关学科 语言学 信息论 生物学 计算机科学 数学 等等...... 2.相关术语 中文信息处理 中文语言处理 计算语言学 自然语言理解 智能化人机接...

3335
JasonhavenDai

人民日报标注语料库(PFR)1.标记说明2.格式说明3.例子4.生语料库和熟语料库5.其他语料库汇总

PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。文章中的每个词语都带有词性...

5438
JasonhavenDai

学习使用Jieba1.Jieba2. 特点3.功能4.安装5.使用6.其他中文分词工具

1.Jieba 相信大多数知道NLP的人都知道什么是Jieba,但对于像我这样的新手而言,也仅限于知道而已,并没有学习过它,使用过它,打算用几天的时间来记录自己...

40813
JasonhavenDai

小爬虫之爬取豆瓣电影排行榜1.技术路线2.任务3.分析4.运行结果5.源码

1.技术路线 python 3.6.0 scrapy 1.4.0 2.任务 爬取豆瓣电影排行榜电影相关信息 2.1查看豆瓣的robots User-agent:...

3488
JasonhavenDai

自然语言处理构建文本向量空间1.百科2.源代码3.参考:

1.百科 TF-IDF 2.源代码 系统环境 python 3.6 scikit-learn==0.19.1 # utf-8 import os im...

2836
JasonhavenDai

《Python自然语言处理》答案第一、二章

第一章 1 12/(4+1) 2 26**100 4 len(text2) len(set(text2)) 7 len(list(nltk.bigrams(te...

36610
JasonhavenDai

Python的机器学习库之Sklearn快速入门1.基本概述2.入门实践3.部分结果

1.基本概述 Scikit-learn 也简称 Sklearn, 是机器学习领域当中最知名的 python 模块之一. Sklearn 包含了很多种机器学习...

3248
JasonhavenDai

自然语言处理基础知识1. 分词(Word Cut)2. 词性标注(POS Tag)3.自动标注4.文本分类5.评估6.从文本提取信息7.分析句子结构《python自然语言处理》各章总结:

1. 分词(Word Cut) 英文:单词组成句子,单词之间由空格隔开 中文:字、词、句、段、篇 词:有意义的字组合 分词:将不同的词分隔开,将句子分解为...

7666

扫码关注云+社区