腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2931)
视频
沙龙
1
回答
有没有
办法
使用
Pandas
将
时间
序列
中
的
行
(
相同
的
特性
,5
行
[
每年
1
行
])转
换为
包含
20列
的
单个
特性
?
python
、
pandas
很抱歉,这个问题与其他问题类似,但我找不到适合我
的
特定情况
的
好答案。 我正在处理一个
时间
序列
的
图像数据。在我
的
数据框
中
,每个特征都有5
行
数据:
每年
1
行
。我想把这五
行
转换成列,这样我就只有一个特征
行
,但我不能丢失或聚合任何数据。我
的
数据帧如下所示: df = pd.DataFrame([[1, 3, 4, 9, 31,
浏览 7
提问于2021-01-28
得票数 0
1
回答
Openrefine基于文本
将
行
转到列
中
openrefine
我收到了一个图书馆目录
中
的
数据
转
储,它是以.txt格式发布
的
。我已经能够
将
数据放入电子表格
中
,但它们都在一列
中
。我想把这些
行
转成几列。数据按以下顺
序列
在这一列
中
:标题文档类型、作者日期因此,我不能根据行数
将
这些记录转
换为
列。 每个标题前面都有“描述”一词。这是贯穿整个数据集
的
一个常规
特性</e
浏览 2
提问于2017-09-29
得票数 2
2
回答
如何对
时间
序列
数据进行转换,将有监督
的
学习算法应用到
时间
序列
数据
中
?
classification
、
time-series
、
random-forest
、
training
为可能是一个非常基本
的
问题事先道歉。 我有一个由对不同客户
的
营销调用组成
的
数据集,其中包括呼叫
的
时间
戳。我
的
目标是训练一个模型来预测一个客户是会根据呼叫
时间
来响应还是忽略它,以及其他功能,比如呼叫者id等等。问题是,调用
的
结果显然是
时间
依赖
的
,也就是说,每个客户端数据点
的
顺序是预测给定
时间
内因变量
的
顺序。我
的
问题是,我如何转换我
的</em
浏览 0
提问于2019-07-08
得票数 1
回答已采纳
2
回答
LSTM特征选择过程
time-series
、
feature-selection
、
lstm
我们需要用LSTM模型实现一个
时间
序列
问题。 但是,在实现
相同
功能
的
同时,我面临
的
主要挑战是功能选择问题。因为我们
的
数据集
包含
2300个观测和600个特征。
将
单个
列视为预测器(我们希望预测
的
特性
) X
的
形状变成,2280×20×1(如果
时间
步长为20)。准确度也很差。此外,尝试与主成分分析,使所有600个特征减少到20个特征保留了大约98%
的
数据
浏览 0
提问于2018-02-16
得票数 9
1
回答
在机器学习算法
中
处理数据帧
中
的
时间
日期特征
python
、
pandas
、
timestamp
'是日期格式(即2020/12/31 18:32:19),对于其他
时间
-日期
特性
也是类似的。我正在尝试对此数据集
使用
基于学习
的
方法,但是,我已经设置了一个函数,该函数
使用
以下代码自动
将
pandas
object特征(例如'plug-in time', 'plug-out time', 'charging].hour+60*df['plug-in time'][row].m
浏览 3
提问于2021-03-01
得票数 0
3
回答
如何以压缩
的
csv或拼花文件(类似的to.gz格式)有效地上传pyspark
python
、
amazon-s3
、
pyspark
、
apache-spark-sql
我在S3
中
有130个GB
的
S3文件,它
使用
从redshift到S3
的
并行卸载加载。因为它
包含
多个文件,所以我想减少文件
的
数量,这样我
的
ML模型(
使用
sklearn)就更容易阅读了。我已经设法
使用
: S3
将
多个数据从spark_df转
换为
火花数据格式(称为spark_df)。 spark_df1
包含
100多个列(
特性
),是我对数百万客户ID
的
<em
浏览 8
提问于2022-05-14
得票数 0
回答已采纳
1
回答
基于学习模式
的
学生考试成绩预测
time-series
、
machine-learning-model
根据https://machinelearningmastery.com/convert-time-series-supervised-learning-problem-python/
的
说法,我可以
将
时间
序列
转
换为
日期对如果我然后
将
涉及一个学生
的
所有
行
合并成一
行
,并具有10,000个
特性
,那么对于一些具有数万个
特性
的
队列,我有一千
行<
浏览 0
提问于2023-01-21
得票数 0
回答已采纳
1
回答
auto列使UL
的
每个LI在一
行
上对齐
css
、
css-multicolumn-layout
我有一个
包含
多个列表元素
的
无
序列
表。我不知道上述ul
中
li元素的确切数量--例如,它可以是3个或4个元素(都是非常简洁
的
元素) --但是我
将
每个li都作为一个block (而不是一个实际
的
列表)进行display,并希望
使用
columns
特性
将
所有元素都设置在一
行
上,
相同
地居中/对齐。但是,如果我
使用
columns: 4,并且只有3个元素,那么它们就像缺
浏览 0
提问于2017-09-11
得票数 2
1
回答
如何在顶点AI AutoML
时间
序列
模型中选择目标列
google-cloud-platform
、
google-cloud-automl
、
google-cloud-vertex-ai
我正在用
时间
序列
AutoML模型测试Google顶点AI。我从Biguery表创建了一个数据集,其中有2列,一列是
时间
戳,另一列是我想要预测
的
数值:salesorderdate是我
的
TIMESTAMP列,orders是我想要预测
的
值。当我继续下一步时,我无法选择orders作为我要预测
的
值,因此该字段没有可用
的
选项:我在这里错过了什么?在这种情况下,
时间
序列
值肯定是目标值吗?这里是否期望有更多
浏览 8
提问于2021-06-25
得票数 1
回答已采纳
2
回答
MySQL联合限制
的
性能
mysql
我有两个不同
的
MySQL表,它们都
包含
时间
序列
数据(因为它们都
包含
一个'timestamp‘列)。除了“timestamp”列之外,这两个表除了“client_id”列之外,没有任何共同
的
特性
。这两个表都以(client_id,
时间
戳)为索引。 我正在尝试
将
这两个表合并为一个分页
的
时间
序列
。具体地说,我
的
意思是,我试图从timestamp排序
的<
浏览 1
提问于2012-04-19
得票数 4
回答已采纳
1
回答
如何
使用
Jeigen覆盖矩阵
的
列/
行
(vs. EJML)
java
、
matrix
、
ejml
我
使用
来表示Java语言中
的
矩阵(Jeigen是Eigen
的
包装器)。这个库又快又简单,但我遗漏了一个很酷
的
特性
。据我所知,Jeigen不支持交换列或
行
(例如,对列进行操作,然后用新值替换列)。Jeigen仅支持设置
单个
条目。或者,也许EJML支持这一点。但是
浏览 4
提问于2016-02-13
得票数 0
1
回答
如何在Python
中
优化正则表达式匹配搜索
python
、
regex
、
search
、
optimization
程序问题 现在我把每一个步骤
的
定义都转换成一个正则表达式,比如.I {qualifier} click on the {place}
将
转
换为
(I (should not|should) click o
浏览 3
提问于2020-04-07
得票数 1
1
回答
将
Parquet文件分区列存储在不同文件
中
python
、
pandas
、
parquet
、
pyarrow
、
apache-arrow
我有一个大型数据集,它收集了许多对象(
行
)
的
属性/
特性
(列)。行数约为100k-1M (行数
将
随着
时间
的
推移而增长)。相反,这些列在逻辑上分成200组,每组有200-1000列。当数据到达时,我希望
将
这组不断增长
的
列存储在parquet
中
。最终,所有列组都将填充数据。随着
时间
的
推移,新
的
对象(
行
)将到达,并且它们
的
数据
将</em
浏览 47
提问于2020-03-05
得票数 3
1
回答
如何设置1dCNN+LSTM网络(Keras)
的
输入形状?
python
、
tensorflow
、
keras
、
lstm
我有以下
的
想法来实施:输入有100个
时间
步骤,每个步骤都有一个64维特征向量Conv1D层将在每个
时间
步骤中提取
特性
。CNN层
包含
64个过滤器,每个过滤器有16个水龙头。然后,最大池层
将
提取每个卷积输出
的
单个
最大值,从而在每个
时间
步骤
中
总共提取64个特征。然后,
浏览 1
提问于2018-04-17
得票数 2
1
回答
使用
scikit对数据进行缩放时
的
奇怪结果
python
、
scikit-learn
、
time-series
、
feature-scaling
我有一个输入数据集,它有4个
时间
序列
,
包含
288个值,为期80天。所以实际形状是(80,4,288)。我想把不同
的
日子聚在一起。我有80天,他们都有4个
时间
序列
:外部温度,太阳辐射,电力需求,电价。我想要
的
是
将
这4个
时间
序列
组合成簇
的
相似的日子分组。属于同一组
的
天数应具有类似的
时间
序列
。 在
使用
k均值或Ward
的</em
浏览 6
提问于2022-08-24
得票数 0
回答已采纳
1
回答
将我
的
数据格式化为RNN输入
的
可取方法
python
、
keras
、
recurrent-neural-network
我有一个dataframe X,其中每一
行
都是一个数据点,每一列都是一个
特性
。标签/目标变量Y为单变量。X
的
一个列是Y
的
滞后值。根据我在这个网站上所读到
的
,batch_size应该尽可能大,而不会耗尽内存。我主要怀疑
的
是n_timesteps。和n_features。 我认为n_feature是X数据
中
的
列数。
浏览 12
提问于2022-02-18
得票数 1
回答已采纳
1
回答
展开、计时步骤、批次大小和隐藏单元
python
、
tensorflow
、
keras
、
lstm
我在这里阅读这个博客是为了了解
的
理论背景,但是在阅读了之后,我有点困惑于什么** 1)
时间
步骤,2)展开,3)隐藏单位
的
数目和4)批大小**?也许有人也可以在代码
的
基础上解释这一点,因为当我查看模型配置时,下面的代码没有展开,但是在这种情况下,timestep在做什么呢?让我说,我有一个长度为2.000点
的
数据,分为40个
时间
步骤和一个特征。隐藏
的
单位是100。批次大小没有定义,模型中发生了什么?history=model.fit(train, train, epoch
浏览 0
提问于2018-05-22
得票数 1
回答已采纳
3
回答
如何为LSTM
时间
序列
预测准备数据
python
、
learning
我有一个
时间
序列
数据
的
二进制分类任务。我
的
CSV
中
的
每14
行
都与一个时隙相关。我应该如何准备这些数据在LSTM中
使用
?换句话说,如何向模型提供这些数据?
浏览 0
提问于2017-03-28
得票数 3
1
回答
为什么
pandas
Dataframe.to_csv
的
输出与Series.to_csv不同?
python
、
python-3.x
、
pandas
、
dataframe
、
csv
我
的
问题是,当我尝试
使用
apply遍历我
的
Dataframe时,我得到了一个Series对象,to_csv方法给了我一个拆分成行
的
str,
将
None设置为"",没有任何,。但是,如果我
使用
for遍历数据帧,我
的
方法
将
获得一个Dataframe对象,并在一
行
中
给出一个
包含
,
的
str,而不会将None设置为""。0.12
使用
f
浏览 28
提问于2021-04-22
得票数 3
回答已采纳
1
回答
如何根据
时间
戳
将
dataframe与json数据同步或合并
python
、
json
、
pandas
、
dataframe
、
merge
有很多关于如何合并两个
pandas
数据帧
的
例子,但我
的
问题是我有两种数据。data1是一个csv数据,我用
pandas
读取它并将其转
换为
dataframe,另一个data2是json格式
的
。在每一列
中
,都有与该
特性
相对应
的
所有值,并且这些值都在这个json
中
。 我
的
目标是基于
时间
戳合并这两个数据集。这非常困难,因为在json
中
,我有一个与每个单独
的</em
浏览 9
提问于2019-11-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 数据分析之NumPy与pandas 的功用
Python中的星号:用途及使用方法
Netflix发布DBLog:一款通用的变化数据捕获框架
Python模块-Pandas(四)文件读写与数据处理
为纯 OpenWhisk 操作创建单元测试
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券