腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
MSSQL记录的JSON解析与处理设计建议
、
、
、
我正在编写一个
框架
,它需要从MSSQL获取大量记录,而且每个记录/行都有一个JSON
数据
,我需要解析这些
数据
,然后从该JSON
数据
中进行一些
计算
。每个记录的解析和
计算
是独立的。因此,为这个
框架
寻找一些设计建议。 没有DB记录:相当
大
,所以需要一些批处理和并行处理。
浏览 0
提问于2014-09-16
得票数 2
1
回答
熊猫群中的多栏连接
、
我有一个
大
的
数据
和一个小的
数据
,我想加入到一起。小
数据
存储与大
数据
按组的值范围相对应的最大每周值。我想加入每组每周的最大值到
大
帧。
大
框架
:datetime group value2014-05-07 B 3 import pandas as pd L.index
浏览 1
提问于2014-08-29
得票数 0
回答已采纳
1
回答
我如何
计算
熊猫的平均真实范围?
、
、
、
、
如何
计算
数据
帧中的平均真实范围?电流
大
电流低当前低-前关 但我不知道该如何为熊猫
数据
框架
设定三个值之间的最高值
浏览 7
提问于2022-04-17
得票数 0
回答已采纳
1
回答
在Hadoop或分布式
计算
框架
中管理多个集群
、
、
、
、
其中一台是主
计算
机,另外四台是从机。有什么好的开源分布式
计算
框架
,我可以轻松地完成上面的任务吗? 提前谢谢。
浏览 0
提问于2018-10-26
得票数 3
回答已采纳
1
回答
sparkSQL的
数据
是否会超过内存?
我在用SparkSQL做一些
计算
。每5分钟就会有一个新的
数据
框架
出现。我需要
计算
一下最近一周的
数据
。 这意味着我需要将12*24*7 =2016年的
数据
合并成一个
大
的
数据
,并运行
计算
。因此,我想知道,如果
数据
太大,不适合在内存中会发生什么?会不会暂时把它换到磁盘上?我是否需要明确要求火花交换,还是它会自动完成?
浏览 2
提问于2016-04-08
得票数 1
回答已采纳
1
回答
如何从小批量中获取原始索引?
假设我有一个作为以下代码的结果的小型批处理:如何获取此小批量的索引作为对原始
数据
的引用?假设我的测试
数据
集是100行。我如何知道100个原始行中的哪10行在小批量中?
浏览 15
提问于2017-01-07
得票数 1
回答已采纳
3
回答
在R中去复制
数据
并创建大小写权重的有效方法
、
、
问题为了加速整个过程,我喜欢通过只获取唯一的行以及它们的案例权重(它们发生的频率)来折叠
数据
框架
。因此,从这个
数据
框架
来看:------------A | B | AC | C | A对于此
数据
框架
电流逼近 目前,我使用dplyr逻辑来完成这个任务
浏览 9
提问于2022-08-10
得票数 1
回答已采纳
1
回答
根据每行的最大值更改所有列
、
、
、
我有一个
大
的
数据
框架
,其中包含从其他列
计算
出来的多个列。这些问题出现在8888和9999的值分别构成NA或拒绝回答的地方。这些值被错误地用于
计算
其他列(例如pricepergram的值),因为它们在
计算
之前没有被指示为NA。 我无法重新
计算
所有的值,所以我想找到一些代码,它将
数据
的每一行作为参数。解决方案需要适用于由250个列组成的
数据
。i需要能够跨多个列应用代码,而不仅仅是一个列。i已经确认,
数据
格式中唯一
浏览 3
提问于2022-08-23
得票数 0
1
回答
R中没有重复项的所有行的和
我有一个
大
的
数据
帧。我需要找到一个特定列的所有行的和,但是重复的项只
计算
一次。例如,z = data.frame(id = c(16249, 16249, 16250, 16251), value = c(1, 1, 2, 3)) 2 16249 14 16251 3 我需要找到列"value“的所有行的和,但是重复的"id”只
计算
一次。
浏览 2
提问于2013-08-13
得票数 0
回答已采纳
1
回答
是否有方法在
大
查询中使用滚动窗口上的percentile_cont()函数
计算
百分位数?
、
我有一个具有下列列的
数据
集理想情况下,我希望从percentile_cont(收入,0.5)中
计算
50%(按城市订单划分,按月划分,范围在前一行和当前行之间但是
大
查询不支持percentile_cont中的窗口
框架
。如果有关于这个问题的工作,谁能帮我一下吗?
浏览 1
提问于2020-08-03
得票数 2
2
回答
如何找出r中第一次观测与前两次连续负观测之间的观测次数
、
我有一个
大
的
数据
框架
,我需要一个函数来自动化这个搜索。基本上,我想找出在第一次观测和第一次连续两次负面观测之间有多少次观测。示例:假设这是我的
数据
,我想
计算
2到-7之间的
数据
点数。非常感谢您的帮助:!
浏览 1
提问于2020-05-25
得票数 3
回答已采纳
1
回答
如何找出第一次观测与最大值观测之间的观测次数
我有一个
大
的
数据
框架
,我需要一个函数来自动化这个搜索。基本上,我想知道在第一次观测和最大值的观测之间有多少次观测。示例:假设这是我的
数据
,我想
计算
2到11之间的
数据
点数。非常感谢您的帮助:!
浏览 0
提问于2020-05-27
得票数 1
回答已采纳
1
回答
加快熊猫日期
框架
的双循环
、
、
、
我想创建一个基于另一个非常
大
的
数据
框架
(df_aug15_exp)的
数据
框架
(df_aug15)。其思想是,对于原始
数据
框架
中的每个元素,我
计算
该元素的行和列的总和,将它们相乘并除以整个
数据
帧的和,如下所示。
浏览 4
提问于2022-10-03
得票数 1
回答已采纳
1
回答
用NA值
计算
/细分来自证券价格的
数据
框架
(XTS/动物园)的回报?
、
、
、
、
我有一个1379x843
大
小的
数据
框架
,行是每日价格,列是证券。 我想根据一天下降30%来
计算
回报和子集,但是我在处理大量NA值时遇到了困难。
浏览 0
提问于2018-06-25
得票数 0
回答已采纳
2
回答
如何将
数据
框架
按多个不同类别进行子集?
、
、
我正在尝试将
数据
框架
划分为多个类别。例如-我的
数据
集看起来类似于我想要做的是对这个
数据
框架
进行子集,所以我只有来自类别B1、O1和H1以及响应变量1和3的样本,而不必
计算
行或列(实际的
数据
集相当
大
)。variable 1, Response variable 3))drop && length(x) == 1L中的错误:“x&y”中无效的“x”类型 只是想知道像这样对
数据</e
浏览 2
提问于2022-06-08
得票数 0
1
回答
使用Pandas处理Python中的大型SQL查询?
、
、
、
、
我想对一些
数据
进行备份测试,这些
数据
将使用Python、psycopg2和Pandas从Postgres
数据
库中提取。将从Postgres提取的
数据
非常
大
(超过10 of )--即使Pandas
数据
帧能够存储这么多
数据
,我的系统也无法以RAM的形式保存这些
数据
。综上所述,我希望我的Python程序需要执行以下操作:2:对
数据
库表运行基本select查询 3
浏览 27
提问于2017-11-02
得票数 3
回答已采纳
1
回答
非常
大
的CSV文件--如何只将某些行读入
数据
帧
、
、
、
、
我有一个非常
大
的csv文件,我不能使用熊猫read_csv加载到我的
计算
机内存。我看着dask.dataframe as ddUser ProductA C 3
浏览 2
提问于2020-04-04
得票数 1
1
回答
现代
数据
仓库的Azure synapse与Databricks
框架
、
我在做
数据
库的工作。我以事实和虚实的形式整理了
数据
。这些
数据
消耗的权力比报告通过突触。如果
数据
已经在databricks层中烹饪,我不知道synapse的用途是什么。为什么我们要在这个
框架
中使用突触。
浏览 2
提问于2022-07-26
得票数 1
2
回答
Ignite使用的内存比预期的多
、
我正在使用Ignite构建一个
数据
计算
框架
。一个很大的问题是内存使用量比预期的要多一点。在Ignite外部使用1G内存的
数据
将在Ignite缓存中使用超过1.5G。我还
计算
了用于每个缓存和缓存条目的额外空间。总的内存使用量仍然没有加起来。会有什么问题呢?是
数据
结构还是配置?
浏览 0
提问于2016-12-03
得票数 3
1
回答
pandas
数据
帧中多行的平均值
、
、
、
我的
计算
方法(SSA)有一个相当
大
的
数据
框架
-大约80000行。我想按几行(例如20行)平均我的
数据
。我该怎么做呢?我有一个
数据
帧,例如: 1. 00h 03h 06h 09h 12h 10 0.003546 0.000885 0.006852
浏览 28
提问于2020-01-08
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
华为计算:上海昇思AI框架&大模型创新中心将启动
华为计算:上海昇思 AI 框架&大模型创新中心将启动
Hadoop计算框架之MapReduce
五大最佳数据框架的快速比较
Ray:为机器学习和大模型而生的分布式计算框架
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券