将pathlib与dataframe一起使用_无法将Dask dataframe与Plotly Dash一起使用_将casefold()与dataframe列名和.contains方法一起使用 - 腾讯云开发者社区

、

我有一个包含文件路径和文件名的数据帧我正在尝试使用这段代码来迭代数据帧并打印文件名当我测试dataframe列中的实际路径名和文件名时，以下命令起作用 from pathlib import Pathpath in Path('Z:\\A\\2021-07-21\\DL\\').rglob('xx_240721_21*_AT_B.txt.bz2'): print(path) 当我尝试使用数据框值解析实际值时，它不起作用 from pathlib

浏览 11提问于2021-07-26得票数 2

回答已采纳

2回答

Python，TypeError:只允许向isin()传递类似列表的对象，传递一个[str]

、

我正在尝试创建一个列status，以显示DataFrame值是否在目录test中。例如，文件夹O:\Stack\Over\Flow\2010是否存在于O:\Stack\Over\Flow目录中。我的pl_dest DataFrame是这样的：0 O:\Stack\Over\Flow\2010代码： {'Folder_Nam

浏览 11提问于2022-11-11得票数 1

回答已采纳

1回答

如何提取和处理zipfile中的所有文件？

、、、、

import reimport pathlib def parse(zip_filenew_name = re.sub("mHealth_", "", old_name) + extension file = file.rename(pathlib.Path

浏览 21提问于2021-07-19得票数 0

1回答

根据条件删除重复项

、、

这是我的密码：from pathlib import Pathimport pandas as pd 'col2': ['red', 'green','orange'],

浏览 2提问于2022-11-06得票数 0

回答已采纳

1回答

使用pathlib创建symlink

、

我想测试Python代码是否与符号链接一起正常工作。如何以Python2/3兼容的方式在基于pathlib.Path的伪造文件系统中创建符号链接(例如，相当于如何使用os.symlink() )？

浏览 17提问于2019-02-07得票数 6

回答已采纳

1回答

通过读取文件名将xl文件编程摄取到pandas数据帧中

、、、、

我希望能够使用pathlib来处理该文件夹，以便自动将我想要的excel文件摄取到各个熊猫数据帧中。我还希望能够使用excel文件的名称(不带文件扩展名)来命名每个新的数据帧import pathlib as pl folder = pl.WindowsPath(r'C:\Users\username\project\output'

浏览 19提问于2021-05-18得票数 1

回答已采纳

2回答

循环访问Python中不同文件夹中的文件

、

我在Python中遇到了一个循环问题。我的文件夹如下所示： |--data_loop |--example2 |--python_jupyter_notebookimport pandas as pd import numpy as

浏览 0提问于2019-04-12得票数 0

3回答

用Pandas读取多个csv文件，分配不同的名称

、、

如何在文件夹中读取不同的csv文件，而不将它们连在一起，而只是将它们分配给原始文件名呢？例如，路径...\table1.csv的文件将被命名为"table1“。

浏览 3提问于2022-06-22得票数 0

回答已采纳

1回答

如何将多个熊猫数据帧收集到一个in循环中

我尝试将许多熊猫数据帧收集到一个循环中/我的代码是：from pathlib import Pathdf = pd.DataFrame() dbf = Dbf5(i.name, codec = '866')t = dbf.to_dataframe() print(

浏览 0提问于2017-12-08得票数 1

1回答

从CSV文件列表生成Pandas DataFrames

、、、

我将每个csv文件的路径以及描述保存到一个DataFrame中。我知道要遍历DataFrame，并将特定的csv文件读入到一个数据帧中，该数据帧的名称是从原始文件名生成的。for file in glob(os.path.join(path, EXT))] # The list of csv file directories is read into a DataFrame# Dataframe is then split into columns based on the \\ found in the

浏览 17提问于2021-11-10得票数 1

回答已采纳

1回答

如何使用jsons迭代文件夹，并在一个csv中转换所有这些

、、

with open('%s/%s' % (path_to_folder, f), 'r') as fo: df = pd.DataFrame

浏览 2提问于2021-02-17得票数 1

回答已采纳

2回答

结合使用pd.read_csv和pd.read_excel

、、

我被分配了一项任务，涉及将pd.read_csv()和pd.read_excel()函数合并到一个名为ingest()的函数中。我一直在尝试使用正则表达式，这样如果文件包含".csv“，它就会执行read_csv()函数，否则就会将其读取为excel文件。到目前为止，这是我的代码 mo = rexf.search(dataframe) if mo == True:df = pd.read_csv(dataframe</em

浏览 1提问于2020-10-14得票数 0

1回答

模拟对外部模块的调用函数

、

我有一堂课，对我读过的熊猫数据做一些验证。这个类看起来像这样(一些简化的东西可能没有意义) read_kwargs = {'sep'='\t',header=None} self.path = path def validate_num_rows(self,threshold: float = 0.1) -> boo

浏览 2提问于2022-05-31得票数 0

回答已采纳

2回答

如何使Python模块跨平台工作(os.path问题)？

、、

因此，我有一些文件布局如下：‘./示例3/ex3A.txt’这在我的linux机器上工作得很好，但我不知道如何在我同事的windows pc上这样做。我尝试过os.join.path等的各种迭代，但我似乎无法让它跨平台工作。import osimport glob #Create list o

浏览 3提问于2017-02-14得票数 1

回答已采纳

1回答

在Pandas中的多个数据帧上应用相同的操作

、、

我在Pandas中处理了大约30个外观相同的csv文件(一分钟的时间序列数据，每个一年，大约100MB)。大多数情况下，我对30个数据帧中的每个数据帧执行相同的操作。有没有一种方便的方法可以一次对每个数据帧应用一个操作，而不是单独保存文件？像这样的东西？ df=df.dropna(subset=['A','B']) df_a = df[(df.C >= 50)]

浏览 0提问于2020-06-09得票数 0

2回答

Pandas:如何获取目录中每个文件行数的数据帧？

、

我有.csv文件(abc.csv、def.csv等)在目录中，我想计算每个文件中的行数，并保存具有名称列和计数列的单个文件。我的预期输出如下： df = name count def ....path = '/some/path/to/file'with open(filename, 'r', encoding=&

浏览 6提问于2020-07-02得票数 0

3回答

如何从位于指定文件夹中的一个文件(具有任意文件名)创建pandas数据帧？

、、、、

我使用了pathlib，但它并不能很好地工作，因为输出数据帧没有给我任何东西。from pathlib import Pathfle = Path(pth).glob('*.tsv') someDf我也尝试过执行以下操作，但输出数据帧将所有列合并为一个用反斜杠分隔的列。f

浏览 29提问于2020-02-26得票数 1

回答已采纳

1回答

如何从CSV自动执行新查询并保存到XLSX

、、、

我开始从事数据分析和Python的工作，目前的工作是导入带有tweet的大型CSV文件，并将其保存为xlsx，格式为:Unicode UTF-8。我一直在以经典的方式一个接一个地做，但我有超过数百个，而且还会有更多，所以我需要自动化它。为了不丢失数据，我需要做的过程如下。我试过用python来做这件事，但到目前为止，我只能做到一个文件夹一个文件夹地做(从文件到文件的改进)，但是te代码丢失了一些数据，我想这是因为它只将文件作为csv打开，并将其另存为xlsx (我不知道确切的原因，因为代码是来自互联网上其他人的集合，抱歉)。currentDirecto

浏览 15提问于2021-02-20得票数 1

1回答

在pdm文件中搜索关键字并提取该关键字

、、

我将文件的路径保存到数据帧中。如何在搜索中添加一种方法，在这些文件中找到单词"ID“，然后在这个单词旁边提取16位数字的随机数？只是为了添加这个ID，就在文件中。我还想将这些I存储在dataframe中。我想自动化它的原因是因为有457个文件。<?file.endswith('.cdm'): cdm_filesdataframe = pd.DataFrame

浏览 1提问于2021-06-25得票数 1

回答已采纳

1回答

将Pandas dataframe与FOR循环一起使用

、

我已经决定，考虑到将使用的大量数据，我想将脚本转换为Pandas。到目前为止，我已经有了这个代码。

浏览 0提问于2014-04-04得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云