使用pandas将顺序数据文件重新格式化为数据帧_将数组重新格式化为数据帧_将列表数据重新格式化为特定的数据帧格式 - 腾讯云开发者社区

python、pandas、sequential

我有一个输入文件，现在已转换为pandas.dataframe。记录/行的顺序包含表单的相关数据 survey, a, b, c observation, a, b, c values, 1, 2,我正在尝试将其重新格式化为行，其中每组值都在单独的行上，并具有其相应的调查、截面和观测。这可以用pandas来完成吗?或者我应该遍历一个if，then else结构？

浏览 15提问于2019-04-16得票数 1

回答已采纳

6回答

使用Pandas数据框运行OLS回归

python、pandas、scikit-learn、regression、statsmodels

我有一个pandas数据框，我希望能够根据B列和C列中的值预测A列的值。下面是一个玩具示例：df = pd.DataFrame({"A": [10,20,30,40,50], 理想情况下，我应该有像ols(A ~ B + C, data = df)这样的东西，但是当我查看像scikit-learn这样的算法库中的时，它似乎是用行而不是列的列表将数

浏览 0提问于2013-11-15得票数 124

1回答

如何以尽可能小的格式存储熊猫数据帧？

python、pandas、save、disk

有很多关于存储pandas数据帧的最有效方法的文档(例如How to store a dataframe using Pandas)，但大多数资源都集中在i/o时间效率上。我希望将大熊猫数据帧保存为更轻量级的格式，而不会丢失任何信息。大熊猫数据帧通常使用csv格式的几Gb磁盘存储。 LightGBM Dataset看起来很有希望，但是我没有设法正确地重新

浏览 9提问于2019-05-24得票数 2

1回答

Pandas写入CSV指定数据类型

python、csv、pandas

有没有一种方法可以防止将Pandas数据帧写为CSV，而不将格式化为字符串的数字转换为数字？假设我有以下数据帧：>>> d=pd.DataFrame(index=['07000','07001','07002'], data=[1,2,3],107002

浏览 1提问于2015-12-29得票数 1

1回答

指定pandas正在读取的日期的格式

python、python-3.x、pandas、datetime

我使用pandas从csv文件中读取多组数据。有没有办法指定用read_csv读入的数据的日期格式？例如，我有一个数据文件，它有一个日期时间列，格式如下：和另一个，格式如下：我想读入这些文件，然后匹配第二个日期格式。然后，我可以使用to_datetime来确保列格式为datetime格式，并且可以

浏览 3提问于2017-11-14得票数 0

1回答

从Pickle打开大型Pandas* DataFrame的大延迟*

python、pandas、dataframe

要创建一个大型熊猫DataFrame (其中dataframe中的每个条目都是一个浮点数，数据和数据按30,000行和几十个列的顺序排列)，可以通过调用以下命令在短时间内完成字典操作： import pandas另外，使用to_pickle和read_pickle可以快速地保存和回忆数据帧。为什么重新加载数据帧的速度如此之快，但对其进行操作却花费了如此长的时间？另外，在重新加载数据

浏览 0提问于2018-02-28得票数 0

回答已采纳

2回答

使用AWS、lambda或Google函数以不同的参数运行大量相同脚本的并行实例

amazon-web-services、google-cloud-platform、cloud-computing、amazon-lambda

我有一个为不同的社交媒体标签收集数据的脚本。该脚本当前发出一系列顺序HTTP请求，将数据格式化为Pandas数据帧，并将其保存到csv中。对于非常流行的哈希标签，运行它需要几个小时。假设我将CSV部分改为使用云存储服务，那么我还需要做什么才能完成我所描述的内容呢？如果我有一个所有我需要的标签的列表，我如何设置AWS或Google函数来同时执行这些函数，以便在收集所有数据之前始终运行

浏览 0提问于2020-06-04得票数 0

1回答

重新格式化后恢复ext2文件系统？

data-recovery、format

我有一个ext2分区，我错误地将它重新格式化为ext4。我立即注意到了这个问题，因为在下次重新启动时，我的系统不会挂载经过重新格式化的分区，该分区获得了一个新的UUID，因此与/etc/fstab中的UUID不匹配。重新格式化后，我没有将任何东西写入磁盘。是否有可能恢复此分区上的数据文件？

浏览 0提问于2014-07-21得票数 0

1回答

将数组重新格式化为数据帧

我有一个数据集，其中包含全球307个地点的十年(3653天的温度)。数据被设置为包含307个经度和307个纬度的3653个数据值(温度)的数组(示例如下)。

浏览 9提问于2019-10-04得票数 1

回答已采纳

2回答

如何在HDBSCAN中打印输出结果

hdbscan

我有ASCII数据，需要使用HDBSCAN对数据进行集群。我得到了标签，但我不知道如何打印输出的集群结果，即来自hdbscan的唯一和分离的结果。

浏览 10提问于2019-04-10得票数 0

1回答

基于两个不同的数据帧创建新的数据帧

python、dataframe

我有两个数据帧(DF1和DF2)，如下所示： project_ID dataID# BBB dataset_02project_ID dataID#

浏览 0提问于2020-08-25得票数 0

2回答

使用来自熊猫DataFrame的数据的Spacy NLP

python、pandas、dataframe、nlp、spacy

我有一个大型的pandas调查字符串响应数据框架，我们想要试用Spacy的NLP的一些功能。我们目前只是在探索这些功能，但正在努力解决如何将数据格式化为与spacy的nlp功能一起工作的格式。最终，我们希望能够查看针对用户数据的字符串响应中的热门主题。如何在数据帧的列上运行nlp管道？还是我绕错了路？

浏览 2提问于2018-10-19得票数 3

1回答

熊猫，Pivot_Table: CSV源文件中的格式和sum字段

python、pandas、csv、pivot-table

我正在尝试将源数据文件中的值字段(从货币)格式化为浮点数，并将其作为支点表值字段的一部分进行汇总。源文件被格式化为CSV。我已经设置了使用熊猫的支点的代码设置，但是很难将货币格式化字段转换为浮动。现在，如果我要运行这段代码，pivot将按列和行正确地格式化，但是value字段是混乱的。对于一种简单的货币字段格式化方法有什么想法吗？我知道我需要删除$ and "，并修剪掉

浏览 2提问于2018-02-11得票数 0

回答已采纳

1回答

pandas:具有保留列顺序的to_csv追加模式

pandas

我正在使用：将多个pandas数据帧逐个写入CSV文件。如何确保新的数据帧将按照以前数据的列顺序写入？非

浏览 21提问于2018-08-02得票数 0

1回答

日期与时间图上数据的颜色映射

python、pandas、imshow

我正在尝试将3个变量x，y，z绘制在2d图上，x(日期)在x轴上，y(时间)在y轴上，z(温度)用色标映射。我在pandas Dataframe中提供了三个变量，并使用datenumber创建了一个额外的列，以便matplotlib可以使用它。import pandas as pdimport matplotlib.dates as mdates ax.xaxis_da

浏览 5提问于2018-12-14得票数 1

回答已采纳

1回答

修改python seaborn boxplot中的时间戳

python、pandas、matplotlib、seaborn

我正在尝试重新格式化使用seaborn创建的boxplot的时间戳标签，尽管这个问题可能适用于所有基于matplotlib的图。图形的x轴按如下方式创建： pd.date_range("2021-01-01", periods=240, freq="H").time 盒子图将x轴标签格式化为'%H:%M:%S'，但我希望格式为'我设法实现了这一点，方法是将索引更改为字符串格式

浏览 13提问于2021-01-03得票数 0

2回答

将数百个数据文件合并到一个主DataFrame中的有效方法是什么？

python、pandas、append、dataframe

与标题一样，我有超过800个数据文件(全部以.csv格式)(每个文件的大小为0-5MB，每个文件包含10列，第1行是标题)，我希望将它们合并到一个DataFrame中。我可以使用Pandas数据帧一个接一个地添加它们，但这非常耗时。fname = "CRANlogs/" + ffiles[0] for i in range(8

浏览 0提问于2015-03-20得票数 1

回答已采纳

1回答

Python跨数据帧匹配项目

python、pandas、string-matching

我在Windows7机器上使用Python3.6。困难的部分来了。我现在想要将其与我的sku相匹配，这样我就可以正确地获得每个商店的每个sku的库存。我的库存数据框是：|NY | Apples |?||NY | Pears |?因此，for循环将迭代，直到它到

浏览 14提问于2017-03-10得票数 1

回答已采纳

1回答

我的时间数据“不匹配格式”。如何正确格式化我的日期时间？

python、pandas、datetime、to-date

我使用的是pandas数据帧，我希望将其中的一列格式化为datetime对象。"object“字符串如下: 2009-01-01T00:00:01+02:00dataset = pd.read_csv('data.c

浏览 11提问于2019-10-23得票数 1

回答已采纳

3回答

R:为dataframe中的每一行创建子图

r、dataframe、bar-chart、subplot

我有以下数据：A 0 3 1 0Q 0 2 4 0编辑:这是我最后想看到的(仅仅是原则布局)：

浏览 4提问于2016-02-19得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云