丢弃pandas数据帧中的所有数据_Pandas数据帧绘图栏丢弃值_通过丢弃两个数据帧(Pandas)的交集来创建数据帧 - 腾讯云开发者社区

、、

我已经使用pandas导入了一个Excel文件作为数据帧。我现在需要删除行41,504 (索引41,505)及其以下的所有行。我已经尝试过df.drop(df.index[41504])，尽管它只捕获了一行。如何告诉Pandas删除该行中的后续内容？我不想按索引范围删除，因为数据集有数万行，而且我不希望滚动整个数据集。谢谢你的帮助。亲切的问候

浏览 103提问于2021-02-01得票数 0

1回答

使用concat作为字典我得到错误:第一个参数必须是可迭代的pandas对象，你传递了一个"DataFrame“类型的对象

、、、

我有一个包含数据帧的字典，看起来像这样： dataframes = {'Df_20100101': DataFrame, 'Df_20100102': DataFrame, 'Df_20100103': DataFrame} 所有数据帧都有相同的变量(价格、数量和日期)和相同的索引。我想把所有不同的数据帧放入一个数据帧中。我使用以下代码： df = pd.concat([pd.concat(v,ignore_index=True) for k,v in dataframes.items()]) 但是，我得到一个错误：the first argum

浏览 10提问于2019-10-23得票数 0

回答已采纳

1回答

Pandas dataframe.drop随机删除行

、、

基于一系列条件，我正在尝试从Pandas数据帧中删除不需要的行。我对每组条件都有一个drop语句-总共有10个条件。但是，行是随机删除的。每次我在不应删除任何行的测试用例上运行代码时，都会删除不同数量的行。我尝试使用inplace=True删除，但仍然会随机删除行。我尝试注释掉除第一个语句之外的所有drop语句--只使用一个drop语句仍然会导致随机删除的行。当我在我的PC上本地运行时，这段代码似乎运行得很好。但是，我需要在服务器上运行它。服务器上安装了更新版本的Python和Pandas。我尝试在服务器上使用与我在PC上使用的相同版本的Python和Pandas，但仍然收到随机丢弃的行。

浏览 250提问于2021-11-12得票数 0

1回答

检查panadas dataframe中的奇异矩阵

、

我正在尝试使用pandas scatter_matrix来显示数据帧内容，例如： scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal='kde') 然而，我得到了一个奇异矩阵错误，因为带有kde选项代码的scatter_matrix试图在没有协方差的情况下求反数据的协方差矩阵。 #see pands.tools.plotting.scatter_matrix n = df.columns.size mask = notnull(df) for i, a in zip(range(n), df.columns):

浏览 0提问于2016-10-16得票数 2

2回答

Python关联(.corr)结果为数据帧

、、、

我正在使用名为"mpg_data“的数据集运行以下代码。 mpg_data.corr(method='pearson').style.format("{:.2}") 结果，我得到了我需要的表形式的数据。然而，当我试图将这些结果赋值给一个变量，以便我可以将它们作为可用的数据帧来获取时，执行以下操作： results = mpg_data.corr(method='pearson').style.format("{:.2}") 结果，我得到了： <pandas.formats.style.Styler object at

浏览 4提问于2018-01-08得票数 0

2回答

使用replace函数计算Pandas dataframe列

、、、

Im working on calculating a field in Pandas dataframe. Learning Python, I'm trying to find the best method. Dataframe is quite big, over 55 mln rows. It has a few columns among whichdateandfailure`‘是我的兴趣所在。所以数据帧看起来是这样的： date failure 2018-09-09 0 2016-05-12 1 2013-12-12 1 2018-05-12 1 2018-05-12

浏览 19提问于2018-07-22得票数 0

回答已采纳

6回答

丢弃pandas数据帧中的所有数据

、、

我想丢弃熊猫数据帧中的所有数据，但我得到了TypeError: drop() takes at least 2 arguments (3 given)。我本质上想要一个只有我的列标题的空白数据帧。 import pandas as pd web_stats = {'Day': [1, 2, 3, 4, 2, 6], 'Visitors': [43, 43, 34, 23, 43, 23], 'Bounce_Rate': [3, 2, 4, 3, 5, 5]} df = pd.DataFram

浏览 64提问于2016-08-27得票数 62

回答已采纳

1回答

如何将for循环中的.pkl文件附加到for循环中创建的pandas数据帧？

、、、、

我有一段看似简单的代码，但不知何故它无法工作。代码的目标是找到文件夹中的所有pickle数据，加载for循环中的第一个数据作为pandas数据帧，该数据帧在以前不存在的变量下命名，如果该变量存在，它应该加载剩余的pickle文件作为pandas，并将它们附加到第一个循环中新创建的pandas数据帧中： import pandas as pd import os # Creating the first Dataframe using dictionary df1 = pd.DataFrame({"a":[1, 2, 3, 4],

浏览 27提问于2020-06-24得票数 3

回答已采纳

1回答

如何将MultiIndex熊猫数据帧转换为Dask数据帧

、、、、

我试图将两个变量(一个ID和一个DateTime变量)为MultiIndexed的熊猫数据帧转换为dask数据帧，但是我得到了以下错误； "NotImplementedError: Dask does not support MultiIndex Dataframes" 我正在使用下面的代码 import pandas as pd import dask.dataframe as dd dask_df = dd.from_pandas(pandas_df) 实际上，我有700多个熊猫数据帧(每个超过100MB)，我计划将每个熊猫数据帧转换为dask，然后将它们全部附加到一

浏览 18提问于2019-07-02得票数 2

回答已采纳

1回答

如何过滤熊猫DataFrame并保留特定元素？

、、、

我有一个pandas数据帧，它是一个50x50相关矩阵。在下面的图片中，您可以看到我的示例 ? 当然，如果可能的话，我想做的是制作一个新的数据帧，它只包含旧数据帧的元素，这些元素高于0.5或低于-0.5，表示强线性关系，而不是1，以避免方差部分。我不认为我所要求的是完全可能的，因为变量x0不会像x1那样有很强的关系，所以新的数据框架看起来不会很好。但是有没有办法快速浏览这个数据帧，找到我提到的值，也许至少把它们插入到一个数组中呢？任何洞察力都会有所帮助。谢谢

浏览 32提问于2020-01-22得票数 1

回答已采纳

2回答

如何在不占用RAM的情况下创建额外的列，然后将其用于ML算法？

、、、、

我有一个包含3m+ (有序)行和100列的数据集，我可以使用Pandas将其加载到我的笔记本中。我想追加大约900列，这些列是使用100个现有的列计算得出的。最终目标是训练几个机器学习模型(NN，随机森林)。当我尝试使用Pandas添加列时，由于RAM不足(我有25 to )，我的机器崩溃了。因此，我尝试使用Dask，它允许我毫无问题地计算900列。然而，Dask数据帧不能用作随机森林(Sklearn)和Keras模型的输入，所以我猜在某些时候您必须将其转换回pandas数据帧。在这一点上我被卡住了。速度是相当重要的，因为我需要经常改装模型。有没有人有好的建议？

浏览 18提问于2021-05-22得票数 1

2回答

如何从数据帧中删除变量中的选定行？

、、、

我正在尝试使用Python和pandas从数据帧中删除没有值的行。选定的行当前在一个变量中，但需要从df中删除它。我尝试过new_df.dpop，但似乎什么都不起作用。有什么建议吗？ novalue_df = new_df[new_df['age'].isnull() & (new_df['churn'] == False) & (new_df['avgBill'] < 40)]

浏览 2提问于2018-03-29得票数 0

2回答

从DataFrame中过滤离群值

、、、

我有一个很大的问题，过滤我的数据。我在stackoverflow和其他页面和教程上读了很多，但我无法解决我的具体问题……代码的第一部分将数据加载到python中，如下所示： import numpy as np import pandas as pd import matplotlib.pyplot as plt from arch import arch_model spotmarket = pd.read_excel("./data/external/Spotmarket_dhp.xlsx", index=True) r = spotmarket['Price

浏览 54提问于2018-06-09得票数 1

回答已采纳

1回答

从pandas dataframe python中删除异常值

、、

我有一段使用pandas创建数据帧的代码 import pandas as pd import numpy as np x = (g[0].time[:111673]) y = (g[0].data.f[:111673]) df = pd.DataFrame({'Time': x, 'Data': y}) #df 这将打印出来： Data Time 0 -0.704239 7.304021 1 -0.704239 7.352021 2 -0.704239

浏览 5提问于2017-08-02得票数 3

回答已采纳

1回答

从excel创建Dataframe

、

我正在尝试导入excel并使用pandas read_excel函数创建数据帧。问题是，我只需要使用从excel开始的C到F列和第17行。如何在pandas中仅选择excel文件的那部分并将其转换为数据帧？谢谢！

浏览 0提问于2020-03-21得票数 0

2回答

将Pandas Dataframe写入DBF文件？

、、、

我正在使用shapefile，它将属性数据存储在DBF文件中。我需要使用Pandas操作属性，并将新的DBF数据写回磁盘。不幸的是，Pandas数据帧没有df.to_dbf方法(而R有)。我到处寻找，但似乎没有看到任何明显的方法来完成这项任务。如何将pandas数据帧保存为DBF文件？

浏览 208提问于2017-07-04得票数 4

回答已采纳

2回答

从多个子文件夹加载未知数量的文件

、、

我在多个子文件夹中获取了不同数量的检测器数据，基本上我需要将它们组合到一个pandas数据帧中。我想知道有没有什么聪明的方法来做这个？使用查找。-name *.cvs | wc -l 给出:例如，1464个文件然后，我必须将其加载到数据帧中。目录结构可能类似于： sub-sub-sub-data / main folder-sub-sub-sub-data \ sub-sub-sub-data tldr:如何将未知数量的数据从多个不同的子文件夹加载到单个pandas数据帧中

浏览 0提问于2020-06-26得票数 0

1回答

将数据从S3读取到pandas的最佳方法

、、、、

我有两个CSV文件，一个大约60 GB，另一个在S3中大约是70 GB。我需要将这两个CSV文件加载到pandas数据帧中，并对数据执行连接和合并等操作。我有一个EC2实例，它有足够的内存供两个数据帧一次加载到内存中。从S3到pandas数据帧读取这么大的文件的最佳方式是什么？另外，在我对数据帧执行了所需的操作之后，输出的数据帧应该被重新上传到S3。将巨大的csv文件上传到S3的最佳方式是什么？

浏览 5提问于2020-05-06得票数 0

3回答

Python: Pandas dataframe -数据被覆盖而不是连接

、、

我想从几个.csv文件中提取数据，并在pandas.To中将它们组合成一个大的数据帧。为此，我创建了一个数据帧，应该用传入的数据帧的数据填充。 final_df = DataFrame(columns=['Column1','Column2','Column3']) for file in glob.glob("file.csv"): name_csv = str(file) logfile = pd.read_csv(name_csv, skip_blank_lines = False) df =

浏览 18提问于2017-03-01得票数 1

回答已采纳

1回答

如何在word2vec上应用pandas数据

、、、

我正在尝试使用W2V。我将预处理后的数据保存为pandas数据帧，并希望对预处理后的数据应用word2vec算法。这是我的数据。http://naver.me/IFjLAHld 这是我的代码。 from gensim.models.word2vec import Word2Vec import pandas as pd import numpy as np df = pd.read_excel('re_nlp0820.xlsx') model = Word2Vec(df['nlp'], sg=1,

浏览 35提问于2021-08-20得票数 0

1回答

在熊猫中读取数据时，将"NA“项解析为NaN值

、、、

我对熊猫很陌生。我已经使用pandas.read_csv加载了csv。我试图不指定dtype，但它太慢了。因为它是一个非常大的文件，所以我也指定了数据类型。然而，有时在数字列中，它包含"NA“。我使用了na_values = 'NA'，它会影响我的数据帧吗？我还是想保留这些行。我的问题是，如果我指定数据类型并添加na_values = ' NA '，NA会被丢弃吗？如果是，我如何在不失去这些na的情况下保持类似的处理时间？非常感谢!

浏览 0提问于2017-08-30得票数 0

3回答

pandas:将数据帧拆分为多个csvs

、

我有一个大文件，导入到Pandas中的单个数据帧中。我使用pandas根据数据帧中的行数将文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9 有没有一种方法可以做到这一点，而不必创建更多的数据帧？

浏览 0提问于2017-11-22得票数 2

1回答

XNA4.0中RenderTargetUsage的澄清

我正在努力理解RenderTargetUsage.DiscardContents的确切含义。文件上说：确定在设置新的呈现目标后如何使用呈现目标数据。DiscardContents -始终清除呈现目标数据。调用GraphicsDevice.SetRenderTarget(null)以返回回缓冲区计数作为设置新的呈现目标(因此清除丢弃以前的目标)吗？在帧的末尾(即当图形设备出现时)，内容是否被丢弃，或者即使在这种模式下，它们是否仍然存在于未来的帧中？

浏览 0提问于2011-12-30得票数 4

回答已采纳

1回答

只导入IDL中必要的CSV列

、、、

我很难在IDL中找到一个函数来复制我在Python中用Pandas所做的事情。我是IDL的新手，几乎没有任何资源是我能找到的。在Python中，我使用以下内容： pd.read_csv('<csv filepath>', usecols=[n]) usecols部分只会拉进我想要的数据帧中CSV的列。在IDL中有办法做到这一点吗？我希望这是有意义的-我在这里的第一篇帖子！谢谢。

浏览 1提问于2018-10-03得票数 1

回答已采纳

1回答

使用pyspark直接从hdfs加载pandas的大数据

、

我直接从数据库中获取数据，大约有5-1200万的数据。当我尝试将其转换为pandas数据帧以进行分析时。由于音量太大，它总是崩溃。举个例子 df1 = spark.sql("select * from database.table") sample = df1.toPandas() ## this is where it wont execute 我读到有人建议使用dask和chunksize。但这是作为csv读取，然后转换为数据帧，否则我将直接从数据库获取。有没有一种有效的方法可以在很短的时间内将这些数据加载为pandas数据帧？

浏览 7提问于2020-06-22得票数 0

5回答

多个熊猫数据帧中列值的频率

、、

我有多个熊猫数据帧(超过70个)，每个都有相同的列。假设每个数据帧中只有10行。我希望在每个数据帧中找到列A‘值，并列出它。示例： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name'

浏览 11提问于2020-09-06得票数 0

回答已采纳

1回答

从多索引Pandas DataFrame中导出/writing到Excel标签

、、、

我想通过第一个索引'0‘将多索引数据帧拆分/切片为第一个索引的每个级别的数据帧(例如，下面将有4个数据帧)。然后，我想将每个数据框导出到EXCEL中的单独选项卡中。我希望得到帮助的最重要的问题是如何编写循环或列表理解，将多索引数据帧拆分成单独的数据帧。示例Dataframe： import pandas as pd import numpy as np arrays = [ np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo',

浏览 17提问于2019-01-27得票数 0

回答已采纳

1回答

如何将文件夹中的多个ann文件(从brat注解)读取到一个pandas数据帧中？

、、、、

我可以将一个ann文件读入pandas dataframe，如下所示： df = pd.read_csv('something/something.ann', sep='^([^\s]*)\s', engine='python', header=None).drop(0, axis=1) df.head() 但我不知道如何将多个ann文件读取到一个pandas数据帧中。我尝试使用concat，但结果并不是我所期望的。如何将多个ann文件读入一个pandas数据帧？

浏览 6提问于2021-08-16得票数 0

回答已采纳

2回答

如何将Python Dataframe转换为列表列表？

、、

我有一个尺寸为21392x1972的Python数据帧。我想要完成的是将数据帧转换为列表列表，这样我的数据帧的第一列是长列表中的第一个列表，数据帧的第二列是具有一个长列表的第二个列表，依此类推。我尝试使用tolist()将数据帧转换为列表列表。现在发生的情况是，我的数据帧的每一行都变成了长列表中的一个列表。但是，我想要完成的是，数据框的每一列都应该成为长列表中的一个列表。我刚开始使用Pandas和Python，所以在这方面的任何帮助都是非常感谢的。干杯! import pandas as pd mydataset = pd.read_csv('final_merged_data.c

浏览 21提问于2019-01-18得票数 0

回答已采纳

2回答

在pandas dataframe列中使用字典键

、

我编写了以下代码，在其中创建了pandas数据帧字典： import pandas as pd import numpy as np classification = pd.read_csv('classification.csv') thresholdRange = np.arange(0, 70, 0.5).tolist() classificationDict = {} for t in thresholdRange: classificationDict[t] = classification for k, v in classificationDic

浏览 1提问于2017-03-19得票数 0

1回答

火花数据帧

、、

星火数据帧和Pandas数据帧的区别是什么？我的理解是，Pandas数据框架主要用于将CSV数据读入DF，在DF中，Spark数据帧用于将弹性分布式数据( RDD )加载到数据帧中，并且可以操作数据帧。请分享你的反馈

浏览 6提问于2020-09-01得票数 0

回答已采纳

2回答

python pandas数据帧线程安全吗？

、、

我正在使用多线程来访问和删除我的pandas数据帧中的数据。正因为如此，我想知道熊猫的数据帧是线程安全的吗？

浏览 1提问于2012-11-28得票数 19

回答已采纳

1回答

iOS游戏套件/蓝牙数据流

、、、、

我写了一个程序，使用gamekit/蓝牙将低质量的视频从一个iOS设备传输到另一个设备。我已经意识到gamekit/蓝牙不应该用于此目的(对于小块数据)，但它确实可以很好地流传输15个低质量压缩jpeg/秒，几乎没有延迟。我的问题是，一旦我提高了从iOS设备发送方到iOS接收方的质量或帧速率，就会出现延迟或延迟，并且不再是实时的。如果有延迟，我希望发送iOS设备以某种方式丢弃帧，以便接收方可以赶上，或者让接收方忽略积压队列。在GameKit中，我将会话模式设置为使用GKSendDataUnreliable，看看它是否可以提供帮助，但无济于事。如果出现延迟，丢弃帧(jpegs)以便iOS接

浏览 2提问于2013-07-31得票数 4

1回答

在Dask中使用尚未实现的Pandas函数

、、、、

我相信在使用Dask数据帧时，我在Dask教程中看到了一个关于如何使用Dask框架中尚未实现的Pandas函数的建议，但我似乎看错了地方。例如，我想使用Pandas函数'ewm‘。作为一种变通方法，我将Dask数据帧转换为Pandas数据帧，在Pandas数据帧上运行ewm，然后将它们转换回Dask，以便以后进行更多内存密集型操作。效率不是最高的。有没有更好的策略呢？

浏览 10提问于2019-06-02得票数 1

回答已采纳

2回答

熊猫通过采集样本读取csv

、、

我有一个很大的CSV文件，我只想从其中抽取1%的样本。有没有一种好方法可以直接将样本读取到pandas数据帧中，而不必读取整个文件，然后丢弃99%的数据？

浏览 4提问于2019-03-03得票数 3

回答已采纳

1回答

从pandas数据帧中删除大量数据

、

我有高度不平衡的数据(使用二进制标签，0占数据的96%，而1只占4%)为了平衡它，我决定删除一些标签为零的行。但是，由于遍历整个数据帧，因此使用pandas.dataframe.drop()方法删除行需要几个小时。删除数据最省时的方法是什么？我尝试过对数据进行排序，然后清除一堆标签为0的行，但不幸的是，我不能更改数据的顺序。我选择了标签为0的行的索引，并从该列表中选择了要删除的随机索引，如下所示：drops = random.sample(zero_indexes, X) (其中X是我想要删除的行数)，但我不确定如何在可接受的时间内删除具有此类索引的行。任何帮助都将不胜感激

浏览 10提问于2019-07-29得票数 1

回答已采纳

1回答

使用PyArrow从多个文件中读取已分区的宗地数据集，然后根据文件名添加分区键

、、、

我有一堆parquet文件，每个文件都包含我的数据集的一个子集。假设文件名为data-N.parquet，其中N是一个整数。我可以全部读取它们，然后将其转换为pandas数据帧： files = glob.glob("data-**.parquet") ds = pq.ParquetDataset( files, metadata_nthreads=64, ).read_table(use_threads=True) df = ds.to_pandas() 这个很好用。它希望在最终数据帧中有一个额外的列，指示数据来自哪个文件。据我所知，ds数据是分区的，每

浏览 48提问于2021-09-29得票数 1

回答已采纳

1回答

如何在多个dataframe lambda函数上实现dask映射分区？

、、、、

我已经使用pandas实现了两个数据帧之间的模糊字符串匹配算法。我的问题是如何将其转换为使用多核的dask操作？我的程序在纯python上运行大约3-4天，我想并行操作以优化时间成本。我已经使用多处理包通过以下代码提取了内核数量： numCores = multiprocessing.cpu_count() fields = ['id','phase','new'] emb = pd.read_csv('my_csv.csv', skipinitialspace=True, usecols=fields) 然后，我必须根据每个字

浏览 3提问于2018-05-19得票数 0

1回答

Dask数据流分析

、、

我有一个数据集存储在一个标签分隔的文本文件中。该文件如下所示： date time temperature 2010-01-01 12:00:00 10.0000 ... 其中temperature列包含以摄氏度(°C)为单位的值。我用达斯克计算日平均温度。这是我的代码： from dask.distributed import Client import dask.dataframe as dd client = Client("<scheduler URL") inputDataFrame = dd.read_table("<in

浏览 1提问于2018-10-12得票数 0

3回答

如何在Pandas数据帧中找到最大值的行和列的索引？

、、

我有一个很大的Pandas数据帧，我想找出最大值所在的列和行(在整个数据帧中)。不幸的是，df.idxmax()只返回每行/列的最高值的索引，而不是整个数据帧的索引。有没有办法做到这一点？

浏览 136提问于2021-07-28得票数 2

回答已采纳

1回答

如何在python中使用Pandas dataframe顺序创建和保存csv文件

、、、

我有一段简单的代码，可以将熊猫数据帧保存到csv文件中。到目前为止，它是通过覆盖文件名来工作的，所以每次我运行它时，它只是用具有相同名称的新文件替换旧文件。有没有可能保存这个数据帧，但让它按顺序创建新文件，即如果目录中已经有一些名为"filename1“的文件，请创建名为"filename2”的新文件，这样原始文件中的数据就不会丢失？ import pandas datamatrix= [[1,2,3],[1,2,3],[1,2,3]]) x=pandas.DataFrame(datamatrix) pandas.DataFrame.to_csv(x,"filena

浏览 86提问于2018-06-16得票数 1

3回答

PANDAS:修剪多个数据帧

、、

我想从几个数据帧中删除行，这样它们的长度都是n。当我尝试使用for- loop时，更改不会在脚本的其余部分持久存在。 n = 50 groups = [df1, df2, df3] for dataset in groups: dataset = dataset[:n] 单独重新定义名称(例如，df1 = df1:n )是可行的，但有哪些替代方法？(通过python或pandas) 更重要的是，为什么for- loop在这里不起作用？ pandas == 0.10.1 python == 2.7.3

浏览 0提问于2013-03-30得票数 1

回答已采纳

1回答

Pandas数据帧和字典的深度副本

、、、

我正在创建一个小的Pandas数据帧： df = pd.DataFrame(data={'colA': [["a", "b", "c"]]}) 我把那个df拷贝了一遍。我使用的不是Pandas方法，而是通用Python，对吧？ import copy df_copy = copy.deepcopy(df) 一个df_copy.head()提供以下内容： ? 然后我将这些值放入字典中： mydict = df_copy.to_dict() 字典看起来是这样的： ? 最后，我删除了列表中的一项： mydict['colA&#

浏览 42提问于2020-01-10得票数 3

回答已采纳

2回答

检查两个数据文件的相等性

、、

检查两个数据格式是否相等的Pythonic方法是什么？我现在所做的是：用pandas.DataFrame.sort_values()对具有唯一值的列对数据帧进行排序使用pandas.DataFrame.reset_index()重新设置数据帧排序后的索引使用pandas.DataFrame.sort_index()按行和列对数据帧索引进行排序然后使用pandas.DataFrame.all()对两个数据帧进行比较。示例代码： (df1.sort_values(['Symbol']).reset_index(drop=True).sort_in

浏览 2提问于2017-02-13得票数 2

1回答

如果有3个或更多的值(天)缺少数据，则删除日期范围内的所有行

、、、

我制作了一个数据帧，其中有一个.isnull列，表示有缺失数据的日期。 import pandas as pd import csv Arbdata = pd.read_csv('Arborg1.csv', header= 0) date_index = pd.date_range(start='1951/01/01', periods = Arbdata.shape[0], freq='d') Arbdata.insert(0, 'TIME', date_index, True) Arbdata = Arbdata.

浏览 9提问于2020-06-16得票数 0

2回答

将数据帧写入SQL的函数

、、

我有一个函数，它接收数据帧并将其作为表写入SQL。 def insert(df): with connection.cursor as cur: cur.execute('''create tablaexyz.xyz (ID integer, first_name varchar(100), last_name varchar(100))''') d

浏览 17提问于2021-04-07得票数 0

1回答

如何根据重采样到ohlcv所需的数据来限制具有历史交易的df的值？

、、、

我正在重采样一个包含历史交易数据的数据帧到一个ohlcv数据帧。每次我进行迭代时，我都会添加一行新的交易数据，这样我就可以根据新的ohlcv计算指标。但我的历史交易数据在每次迭代中都会变大，我只需要最后22个(实际上是21个，但第一个值可能是不完整的，所以21 + 1) ohlcv值。这使得我的程序在一段时间后运行得非常慢。有没有办法删除不需要的交易数据？数据帧交易数据： Unnamed: 0 trade_id price amount taker_side_sell timestamp 2020-12-03 17:40:57.5

浏览 19提问于2021-01-05得票数 0

2回答

追加在for循环中生成的pandas数据帧

、

我在for循环中访问一系列Excel文件。然后，我将excel文件中的数据读取到pandas数据帧中。我想不出如何将这些数据帧附加在一起，然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。这是我尝试过的： for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data = pandas.DataFrame.append(data) # requires at least two arguments appended_data.to_excel(&

浏览 2提问于2015-02-23得票数 111

回答已采纳

1回答

使用.concat创建pandas数据帧时包含空序列

、、、

更新:至少从pandas 0.18.1版本开始，这不再是一个问题。连接空序列不再丢弃它们，所以这个问题已经过时了。我想使用.concat从系列列表中创建一个pandas数据帧。问题是，当其中一个序列为空时，它不会包含在结果数据帧中，但是当我随后尝试用多索引重命名它的列时，这会使数据帧成为错误的维度。更新:这里有一个例子... import pandas as pd sers1 = pd.Series() sers2 = pd.Series(['a', 'b', 'c']) df1 = pd.concat([sers1, sers2], axi

浏览 2提问于2015-05-29得票数 6

回答已采纳

4回答