首页
学习
活动
专区
工具
TVP
发布

悦思悦读

IT技术(人工智能,大数据)和职场话题
专栏作者
170
文章
224054
阅读量
49
订阅数
【文本分析】怎样把文档转换成向量
文本分析 文本分析指从文本中抽取出的特征来量化来表示文本信息,并在此基础上对其进行基于数学模型的处理。它是文本挖掘、信息检索的一个基本问题。 在“大数据”盛行的今天,对于非结构化信息的处理已经成了许多工作的必选项,而自然语言书写的文本,就是最典型的一种非结构化信息。 文本分析已经从学院派象牙塔中的研究课题逐步渗入到各个应用领域。对于正在做或者有志于做数据分析的人,掌握基本的文本分析知识和技法,已经成为必要。 向量空间模型 针对文本的具体操作很多,最典型的就是分类和聚类。引入机器学习的办法,让程序自己“学会”
叶锦鲤
2018-03-15
2.5K0
开发一款A股选股器
作者在自学机器学习的过程中,尝试开发了一个基于机器学习的A股选股工具。本文是在赤兔的“数据挖掘”小组分享的此次开发过程和心得体会的整理。 股票价格的可预测性——工具的意义 关于股票价格的可预测性,我想
叶锦鲤
2018-03-15
2.4K0
数据科学家眼中的大数据和云计算
本次分享第【1】部分:什么是数据科学。 本次分享第【2】部分:如何从小白成长为数据科学家。 本次分享第【3】部分:如何以Python为工具走入数据科学之门。 分享主题:Data Science学习分享
叶锦鲤
2018-03-15
1.5K0
什么是数据科学
本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【1】部分。 分享主题:Data Science学习分享会 分享时间:2016年4月18日晚8:00-10:00 分享地点:赤兔“数据挖掘”小
叶锦鲤
2018-03-15
1.1K0
如何从小白成长为数据科学家
本文是作者在赤兔APP“数据挖掘”小组内在线分享的记录的第【2】部分。 本次分享第【1】部分:什么是数据科学。 分享主题:Data Science学习分享会 分享时间:2016年4月18日晚8:00-
叶锦鲤
2018-03-15
8900
数据挖掘_R_Python_ML(2): Linear Regression vs SVR
在上一篇“数据挖掘: R, Python,Machine Learning,一起学起来!”中,我们介绍了用R进行线性回归的例子。 这次我们来看看,同样一份简单的无噪声数据,用线性模型和支持向量模型分别进行回归,得出的结果是否一致。 数据我们仍然用上次的y = x + 2的那份lrdata_1.csv。要用SVR模型,我们需要安装一个新的package —— e1071。 打开R后操作如下: > install.packages("e1071", dep = TRUE) > library(e1071) >
叶锦鲤
2018-03-15
1.4K0
数据挖掘: R, Python,Machine Learning,一起学起来!
大数据概念的火爆带动了相关工具方法的流行。大数据工具中,R和Python以其开源、免费、简单易用、大量算法库和社区支持等特质赢得了一众人心。机器学习则以其高大上的出身,和逐步广泛的应用,成为学习热点。越来越多的人有意学习这些工具、语言和算法。 想学就去学,还在等什么?让我们开始吧! 不同于典型的,先读书再做题,全部学会了再应用的学校真传学习法,我们来尝试另一种,带着任务学习,多头并进的方法。把R,Python和机器学习一网打尽。 线性回归,无疑是所有机器学习算法中最简单的一种,那么我们就从这里入手吧。想要了
叶锦鲤
2018-03-15
6830
数据挖掘R_Python_ML(3): 用R实现一个简易推荐系统
推荐系统在现实生活中应用甚广,电商、社区、社交平台,无不充斥这各种各样的推荐。其实,推荐的原理很简单,无论是给人推荐物,还是给人推荐人,都是无外乎找到和被推荐者具有相同特质的其他用户,看看那些用户结交/买了/浏览了哪些被推荐者没有光顾过的人/商品/书籍/电影/音乐/etc.,将其推荐给被推荐者。 下面我们假设下列文件是一个电影网站的内部记录: uid,m1, m2, m3, m4, m5, m6, m7, m8, m9, m10 1,5,3,0,4,0,0,1,2,4,4 2,3,1,2,0,0,2,0,0
叶锦鲤
2018-03-15
6340
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档