悦思悦读-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

悦思悦读

IT技术（人工智能，大数据）和职场话题

专栏成员

170

文章

239933

阅读量

49

订阅数

【文本分析】怎样把文档转换成向量

数据挖掘 NLP 服务

文本分析文本分析指从文本中抽取出的特征来量化来表示文本信息，并在此基础上对其进行基于数学模型的处理。它是文本挖掘、信息检索的一个基本问题。在“大数据”盛行的今天，对于非结构化信息的处理已经成了许多工作的必选项，而自然语言书写的文本，就是最典型的一种非结构化信息。文本分析已经从学院派象牙塔中的研究课题逐步渗入到各个应用领域。对于正在做或者有志于做数据分析的人，掌握基本的文本分析知识和技法，已经成为必要。向量空间模型针对文本的具体操作很多，最典型的就是分类和聚类。引入机器学习的办法，让程序自己“学会”

2018-03-15

2.6K0

开发一款A股选股器

机器学习数据挖掘

作者在自学机器学习的过程中，尝试开发了一个基于机器学习的A股选股工具。本文是在赤兔的“数据挖掘”小组分享的此次开发过程和心得体会的整理。股票价格的可预测性——工具的意义关于股票价格的可预测性，我想

2018-03-15

2.4K0

数据科学家眼中的大数据和云计算

大数据 python 数据挖掘

本次分享第【1】部分：什么是数据科学。本次分享第【2】部分：如何从小白成长为数据科学家。本次分享第【3】部分：如何以Python为工具走入数据科学之门。分享主题：Data Science学习分享

2018-03-15

1.6K0

什么是数据科学

数据分析数据挖掘大数据

本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【1】部分。分享主题：Data Science学习分享会分享时间：2016年4月18日晚8：00-10：00 分享地点：赤兔“数据挖掘”小

2018-03-15

1.2K0

如何从小白成长为数据科学家

大数据数据挖掘数据分析机器学习神经网络

本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【2】部分。本次分享第【1】部分：什么是数据科学。分享主题：Data Science学习分享会分享时间：2016年4月18日晚8：00-

2018-03-15

9180

数据挖掘_R_Python_ML(2): Linear Regression vs SVR

数据挖掘 python r 语言

在上一篇“数据挖掘: R, Python,Machine Learning,一起学起来!”中，我们介绍了用R进行线性回归的例子。这次我们来看看，同样一份简单的无噪声数据，用线性模型和支持向量模型分别进行回归，得出的结果是否一致。数据我们仍然用上次的y = x + 2的那份lrdata_1.csv。要用SVR模型，我们需要安装一个新的package —— e1071。打开R后操作如下： > install.packages("e1071", dep = TRUE) > library(e1071) >

2018-03-15

1.4K0

数据挖掘: R, Python,Machine Learning,一起学起来!

数据挖掘 python r 语言机器学习

大数据概念的火爆带动了相关工具方法的流行。大数据工具中，R和Python以其开源、免费、简单易用、大量算法库和社区支持等特质赢得了一众人心。机器学习则以其高大上的出身，和逐步广泛的应用，成为学习热点。越来越多的人有意学习这些工具、语言和算法。想学就去学，还在等什么？让我们开始吧！不同于典型的，先读书再做题，全部学会了再应用的学校真传学习法，我们来尝试另一种，带着任务学习，多头并进的方法。把R，Python和机器学习一网打尽。线性回归，无疑是所有机器学习算法中最简单的一种，那么我们就从这里入手吧。想要了

2018-03-15

7120

数据挖掘R_Python_ML(3): 用R实现一个简易推荐系统

数据挖掘 python r 语言

推荐系统在现实生活中应用甚广，电商、社区、社交平台，无不充斥这各种各样的推荐。其实，推荐的原理很简单，无论是给人推荐物，还是给人推荐人，都是无外乎找到和被推荐者具有相同特质的其他用户，看看那些用户结交/买了/浏览了哪些被推荐者没有光顾过的人/商品/书籍/电影/音乐/etc.，将其推荐给被推荐者。下面我们假设下列文件是一个电影网站的内部记录： uid,m1, m2, m3, m4, m5, m6, m7, m8, m9, m10 1,5,3,0,4,0,0,1,2,4,4 2,3,1,2,0,0,2,0,0

2018-03-15

6760

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态