腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
:
R
中大
数据
的
优化
r
、
optimization
、
mle
我有一个面板
数据
,由5年内5908个个体观察组成。我想使用optim()包来估计最大似然估计器。这是我
的
代码 library(pglm)data("HealthIns")x3<-data.matrix(dat$child)X3<-matrix(data=x3,nrow
浏览 25
提问于2021-04-09
得票数 0
1
回答
R
中大
df
的
距离distHaversine模型
的
优化
r
、
optimization
、
haversine
我正在处理一个大型
数据
集,并尝试在具有8 8GB
的
本地计算机上运行地理空间分析。看起来我已经超出了我
的
机器
的
资源,我想知道我是否可以
优化
我
的
模型,以便我可以在我
的
机器上运行它。group_by(station) %>% 是否可以计算距离,然后通过station在station中找到最小距离,这样我就不会以stations
的
数量乘以area
的
数量而结束?或者,有没有其他解决方案可
浏览 4
提问于2017-02-22
得票数 1
回答已采纳
1
回答
通过拆分地域实现HBase负载均衡
java
、
hadoop
、
hbase
我有一个由5个节点组成
的
HBase集群,其
中大
部分是获取顺序
数据
的
输入请求。
r
-2(k2 to k3) on server s2,
r
-4(k4 to k5) onserv
浏览 2
提问于2012-06-18
得票数 3
1
回答
优化
R
中大
数据
文件
的
循环,可能使用Rcpp
r
、
performance
、
loops
、
rcpp
我在
R
中有一个循环,这是相当慢
的
(但很有效)。目前,这个计算在我
的
笔记本上大约需要3分钟,我认为它还可以改进。最后,我将循环许多
数据
文件,根据这些代码
的
结果运行计算,如果可能的话,我希望使当前
的
代码更快。我正在寻找关于如何改进
R
代码和/或更正Rcpp代码以提供正确
的
结果而不是在过程中崩溃
的
反馈。 (虽然我在下面发布
的
代码没有显示出来,但
数据
以
数据
的
方式加
浏览 4
提问于2017-10-11
得票数 5
回答已采纳
1
回答
R
中大
象
数据
的
网络抓取
html
、
r
、
web-scraping
我正在使用
R
编程语言。one_third">address_4,<br />phone_4我正试图将以下信息提取到
数据
框架中city_4 phone_4library(rvest) simple <- read_html("my_website.html&qu
浏览 10
提问于2022-06-24
得票数 1
回答已采纳
2
回答
R
中大
数据
的
计数算法
r
、
algorithm
、
bigdata
、
counting
我有一个大
数据
框架,有近100万行(事务)和2600列(项)。
数据
集中
的
值是1和NA,所有值
的
数据
类型都是因子。我想在
数据
帧
的
末尾添加一个新列,它显示每一行中所有1
的
和。下面是我编写
的
R
代码: counter<-0 if(!counter<- counter+1
浏览 4
提问于2013-09-12
得票数 1
回答已采纳
2
回答
R
中大
数据
集
的
匹配
r
我从
R
.
的
一位教授那里得到了,我想出了以下几点:combos1922,2437,2714,2491,1886,2812,426,1673,94,2139,2569,496,2249,1553,1580) 我认为代码所做
的
是: 最后
浏览 2
提问于2015-06-20
得票数 2
1
回答
R
中大
矩阵
的
直方图
r
、
matrix
、
histogram
我在
R
中有一个大
的
,平方
的
稀疏矩阵(大约30M
的
实数),我想看到它
的
值
的
分布。如果我使用hist函数,因为大多数值都是0,我首先得到一个很高
的
条条,然后得到一个非常接近0
的
很长
的
尾巴,类似于: 因此,我想我应该只打印非零值,或者重新排列这些值,以便以一种简单
的
方式显示非零值
的
模式
浏览 1
提问于2011-08-26
得票数 3
回答已采纳
1
回答
R
中大
数据
的
多条件匹配
r
、
dataframe
、
dplyr
、
tidyr
下面我提到了两个
数据
框架:Val1 Val2Bittar Gourd vegetbleBitter Gourd Vegetable B-II我在DF_1中
的
Val1和Val2中有一些错误( Val1和Val2中
的
字符串在拼写上是不同
的
),并且在DF_2中有正确
的
列表。只想将V
浏览 0
提问于2018-04-03
得票数 3
回答已采纳
2
回答
R
中大
数据
的
数据
格式更改
r
、
dataframe
我试图将长格式
的
data.frame (5列:"person_id" "item_id" "item_type" "gender" "item_trans")转换为宽格式,以便每个person只占用data.frame
的
一行。我已经尝试了以下方法,但没有成功,我
的
代码在基
R
中有快速修复吗?
浏览 1
提问于2020-05-02
得票数 1
回答已采纳
1
回答
加速
R
/sparkR
中大
数据
的
udf
r
、
apache-spark
、
udf
我使用
的
是在本地运行
的
spark 2.1.0,它在一个16核节点上运行,具有充足
的
内存。我循环遍历大约50个文件,每个文件有250M行。在UDF阶段,我有一个包含两个字符串
的
SparkDataFrame。structField("division", "integer"))对于每个
数据
集运行大约2小时是非常慢
的
。在250个分区
的
情况下,代码只是挂在那里,5000个分区将在4h,50k
的
分区上运行2小
浏览 10
提问于2017-03-16
得票数 0
3
回答
基于
R
中大
量列
的
数据
设置
r
、
filter
、
match
、
subset
提前感谢您
的
帮助!我有一个有很多列
的
dataframe,我希望筛选它只显示每个列中匹配特定值
的
行。我可以很容易地产生我想要过滤
的
条件,但是我觉得有一种方法比单独过滤每个值更容易过滤
数据
。对于一个可重复
的
示例,我将生成一个具有大量列
的
数据
集,该
数据
集将使用字谜生成匹配
的
条目。我不仅在寻找所有的副本,而且每个副本都有重复
的
--我在寻找给定测试值
的
副本(下面是test)。很高兴有人帮忙!
浏览 7
提问于2022-09-19
得票数 1
回答已采纳
1
回答
R
中大
数据
集
的
层次聚类分析
r
、
cluster-analysis
、
large-data
我想知道在
R
中对50000x3000
的
大
数据
运行层次聚类分析最好(也是最快)
的
方法是什么?为
数据
获取dist()似乎是一项无休止
的
工作... 非常感谢!下午
浏览 2
提问于2013-10-31
得票数 2
1
回答
替换
R
中大
矩阵
的
值
r
、
matrix
、
vector
、
replace
我有一个很大
的
矩阵(50X10,000),其中包含表示向量值索引
的
整数。我想用索引
的
实际向量值替换表示矩阵中向量值索引
的
整数。下面是值
的
向量dat.full$year.total: [19] 13.51 20.56 20.03 18.33 24.30 19.65 13.99 18.84 18.61 18.70 18.39 13.80我尝试使用像mat<-matrix(replace(mat, row(dat.full), dat.full$year.total))这样
的
repla
浏览 17
提问于2020-11-06
得票数 0
回答已采纳
1
回答
加快
R
中大
数据
for循环
的
处理时间
r
、
performance
、
for-loop
、
execution
我有非常大
的
数据
集,bdd_cases有15万行,bdd_control包含1500万行。在这里,我缩小了这些
数据
集
的
大小,并将其作为简单
的
驱动器链接。下面的for loop就是为此目的编写
的
,对于这里给出
的
小
数据
集示例来说,它非常有效。即使对于这个小
数据
集,它也需要大约13秒
的
时间。%>% # finally add this matched case and control to the empty dat
浏览 1
提问于2021-12-07
得票数 0
回答已采纳
5
回答
提取
R
数据
中大
于某些值
的
列
r
我有个
数据
:0.105 0.234 0.67 0.890.003 0.0020.6 0.67我想从上面的
数据
中提取值大于0.6
的
所有列,如下所示:0.67 0.890.6 0.67以下是我
的
代码不起作用: f
浏览 0
提问于2019-03-20
得票数 1
回答已采纳
1
回答
R
中大
圆距离
的
计算
r
、
matlab
、
latitude-longitude
、
great-circle
在过去,在MATLAB中,我使用大圆距离计算来计算给定
的
点
的
长度和长度
的
索引。我会和你分享我
的
代码。我很难理解
R
中
的
等价函数是什么样子
的
,或者on是否存在?我已经找到了一些代码来显示两点之间
的
距离,但是没有一个代码可以帮助我索引我
的
数据
。 这是我
的
MATLAB代码!distance[i,j] = ind2sub(siz
浏览 14
提问于2019-05-21
得票数 0
2
回答
R
中大
文件
的
处理
sql
、
r
、
data.table
我有15个
数据
文件,每个大约4.5GB。每个文件为大约17,000名客户提供了一个月
的
数据
。综合起来,这些
数据
代表了15个月中17,000名客户
的
信息。我想重新格式化这个
数据
,这样,我就可以为每个客户和他们
的
所有
数据
提供17,000个文件,而不是每个月代表
的
15个文件。问题是它
的
速度非常慢。以我
的
速度,它将需要一个星期或更多
的
时间来完成,而我没有那么多时间。你们中有谁在
R<
浏览 6
提问于2015-04-12
得票数 8
回答已采纳
2
回答
R
中大
数阶乘
的
计算
r
、
factorial
任务:计算一个大数
的
阶乘。在P中,阶乘只能计算到170。> factorial(170)对于大量
的
数字,会发生溢出:[1] InfIn factorial
浏览 0
提问于2019-08-20
得票数 0
回答已采纳
3
回答
删除
r
中大
数据
集中
的
行
的
问题
r
我写了一个脚本,删除20%
的
单元格比10小
的
行。它在小
数据
集上工作很好,但对于大
数据
集却是无用
的
。有人能帮我吗?这是我
的
剧本: row.names
浏览 0
提问于2014-02-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R清洗数据之我见
R语言入门–什么是R语言,为什么选择R语言用于机器学习或数据挖掘
R语言入门篇——R的安装和认识R的程序包
R语言数据分析
大数据之下的R语言的使用
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券