首页
学习
活动
专区
工具
TVP
发布

企鹅号快讯

企鹅号技术类相关资讯
专栏成员
3887
文章
4689139
阅读量
292
订阅数
GGTREE,让进化树不再单调
本文介绍了一款名为GGTREE的R语言包,它可用于绘制进化树并添加注释信息。该包支持多种数据格式,包括newick、nexus、NHX、phylip和jplace,并能够与其他软件输出的文件进行很好的兼容性。作者还提供了丰富的代码示例和博客文章,以便读者更好地理解和使用该包。
企鹅号小编
2017-12-29
1.5K0
R语言实战:评分与销量有相关性吗?
企鹅号小编
2018-01-04
7270
R语言的最好资源,一个就够!
本来我可以起个骚气一点的名字 那一晚,我灌醉了这个男人,逼他说出了所有真相 但是那样很无聊,而且我不觉得有趣,我现在想做的就是,如何成为一位优秀的称职的R语言讲师。 其实我的目标是,中国会做实验的临床医生中最优秀的R语言老师。 这个是可以完成的。 一维世界比的是长度,二维比的是面积,三维空间比的是体积,我限定了实验,临床,R语言这三个维度,已经是很小的世界了。 就跟微博起初限定140字发言,大部分QQ空间用户不能理解一样, 我的课程被限制在3个小时当中,可是3个小时能学啥呢?别人不都是2天48小时的课程
企鹅号小编
2018-01-11
1.9K0
R语言能处理大数据吗?三点建议让你更好使用R语言
R语言究竟能不能处理大数据,其实这个问题的答案取决于你怎样定义所需处理的大数据。R是一种语言,同时也是一种工具,并且是运行在电脑上的,运行的结果也受到电脑的性能影响。那么既然要处理大数据,关键在于如何提高使用R语言处理分析数据的效率。 简单说,有三点: 1)使用运行速度更快的电脑; 2)学习使用各种高效的package; 3)使用Revolution R代替原生的R程序。 第一点暂不讨论,从第二点说起吧。 1. 适合处理大数据的R package 众所周知,R语言的主要优势在于各种包,有的包可以极大的提高工
企鹅号小编
2018-02-07
2.3K0
浅谈机器学习业务方面使用R+Hadoop 是否可靠
众所周知,R 在解决统计学问题方面无与伦比。但是 R 在数据量达到 2G 以上速度就很慢了,于是就催生出了与 hadoop 相结合跑分布式算法这种解决方案,但是,python+Hadoop 这样的解决方案有没有团队在使用?R 这样起源于统计学的计算机包与 Hadoop 相结合会不会出问题?因为他们在不懂R和Hadoop的特征应用场景的情况下,恰好抓到了一根免费,开源的稻草。 R: R的应用场景不在于无与伦比的统计学习能力,而在于 结构化数据 下无与伦比的单位代码产出量。神经网络,决策树等基于结构化数据的 算
企鹅号小编
2018-02-08
6730
如何将机器学习的模型部署到NET环境中?
【IT168 资讯】对于以数据为中心的工程师来说,Python和R是数据中心最流行的编程语言之一。但是,它们并不总是构建应用程序的其余部分的语言。这就是为什么你有时需要找到一种方法,将用Python或R编写的机器学习模型部署到基于.NET等语言的环境中。 在本文中,将为大家展示如何使用Web API将机器学习模型集成到.NET编写的应用程序中。 输入:Flask 我们可以使用Flask作为共享和主持机器学习预测的一种方式。让我们使用来自著名的Kaggle比赛的Titanic 数据集。首先,创建一个新文件,并
企鹅号小编
2018-02-08
1.9K0
R包系列——stringr包
stringr包是Hadley Wickham大神贡献的R包之一,主要用于字符串的处理。对于经常需要对数据进行预处理的分析人员来说,简直是一把“利器”,可谓是上能屠龙,下能剔牙。其用法相比于R自带的函数,更加简单明了。stringr包在我工作中,是属于频繁使用的R包之一。简单的用法也是深入我心,强烈推荐使用该包进行字符串的预处理。 接下来,根据我在工作中使用到的stringr包的场景,介绍一下这些函数的用法。 字符拼接 场景:在读入csv或者xlsx格式文件时,根路径一般不一致,然后我一般使用全名路径。
企鹅号小编
2018-02-11
2.3K0
R实战——大众点评-汉拿山评论情感浅析
有实际的需求才有行动的动力,因为一个朋友开了一家烤肉店,在大众点评上线了团购套餐,遭遇了几次中差评,朋友第一次接触这个,也不知道怎么回复和处理,于是向我寻求帮助。本人也不知道如何处理,正好最近在学R语言,于是就想到了不如通过R语言编写个简单的爬虫抓取大众点评上评论,参考其他店的回复和处理方式。爬取了数据,又可以拿来练手,做个简单的情感分析。 本文主要分以下三部分: 第一部分,编写爬虫抓取数据,主要的R包有XML包,RCurl包,readr包 第二部分,清洗数据和分词,主要的R包有stringr包,Rword
企鹅号小编
2018-02-12
1.3K0
左手用R右手Python系列——多进程/线程数据抓取与网页请求
这一篇涉及到如何在网页请求环节使用多进程任务处理功能,因为网页请求涉及到两个重要问题:一是多进程的并发操作会面临更大的反爬风险,所以面临更严峻的反爬风险,二是抓取网页数据需要获取返回值,而且这些返回值需要汇集成一个关系表(数据框)(区别于上一篇中的二进制文件下载,文件下载仅仅执行语句块命令即可,无需收集返回值)。 R语言使用RCurl+XML,Python使用urllib+lxml。 方案1——自建显式循环: 📷 📷 整个过程耗时11.03秒。 方案2——使用向量化函数: 📷 整个过程耗时9.07m。 方案
企鹅号小编
2018-02-23
1.1K0
大佬 Python 对阵新秀 Julia,谁能问鼎机器学习和数据科学?
关键时刻,第一时间送达! 【CSDN 编者按】在数据科学领域,你最常用的编程语言是哪种?对此,不同职业背景下的开发者答案各尽不同,一般来说,Python 和 R 语言是需要重点掌握的,但是如今有一枝独秀悄然而至,其创作理念是像 Python 一样通用、像 R 语言一样适用于统计、像 Perl 一样适用于字符串处理、像线性代数 Matlab 一样强大、像 Shell 一样擅长粘合程序,且可以像 C 语言一样高效,它的名字叫做——Julia。如今,在面对 Python 俨然已成为数据科学和机器学习领域的中流砥柱
企鹅号小编
2018-01-23
1.6K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档