腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3314)
视频
沙龙
1
回答
如
何用
Python
读取
多个
文件
,
并
组合成
单个
数据
帧
,
每个
文件
都有
标识符
?
、
我想从一个目录中读入
多个
文件
,为
每个
文件
添加一个
标识符
,并将它们连接到一个
数据
帧
中。下面是一个包含两个
文件
的示例,但我正在寻找一种更有效的方法来将该过程推广到
多个
文件
。我想添加一个标识
每个
文件
的id列(因此我的问题与this略有不同) Reprex: # file1.csv df1 = pd.read_csvfil
浏览 22
提问于2021-08-30
得票数 1
3
回答
读取
多个
csv
文件
时保留
文件
名
我正在
读取
多个
csvs,
每个
csvs
都有
关于
单个
股票的
数据
。我使用下面的代码来分别
读取
它们,以便进行比较。这些
数据
可以很好地处理,但我在
读取
csv
文件
时丢失了它的名称。所以我不知道哪个dataframe是
python
中的哪个股票。有没有办法用csv
文件
的名称记录或标记
每个
数据
帧
?path =r'/Users&
浏览 44
提问于2019-04-11
得票数 0
3
回答
如何将
标识符
列添加到批现有
文件
中?
、
、
我正在运行一个不断生成
单个
.csv
文件
的计算机模型。
每个
文件
都有
一个与地理位置和实验处理相对应的唯一
文件
名。
每个
文件
包含相同的
数据
。我想将这些
文件
合并成一个
数据
框架,可以在R中进行统计分析。问题是,
单个
文件
没有
标识符
,无法说明它们所代表的位置或处理。无法让计算机模型添加此信息(!?!)。因此,我希望获取目录中的所有.csv
文件
,
浏览 3
提问于2015-10-26
得票数 1
回答已采纳
1
回答
如何根据列的值范围与熊猫分开
数据
框架?
、
、
、
、
这是一个有点奇怪的问题,但我一直在以
python
中json
文件
的格式从api中导入属性
数据
。然后,我使用Pandas将json转换为dataframe。
每个
属性都被分配一个名称、一个属性id和地址,并为属性中的
每个
单元
都有
一个记录。理想情况下,我希望创建由属性id分隔的
多个
数据
帧</em
浏览 5
提问于2021-12-22
得票数 1
回答已采纳
1
回答
读取
多个
xlsx
文件
以分离
数据
帧
、
、
寻找一种一次从
文件
夹
读取
多个
xlsx
文件
的方法,将
每个
文件
中的
每个
单独的工作表加载到一个单独的
数据
帧
中。我找到的大多数解决方案,
如
purrr::map_ df /:map_dfr::map_dfr似乎都是为了同时将它们拼接成一个df。上下文:虽然我最终打算将这些
文件
合并到一个df中,但是在这样做之前,
每个
选项卡
都有
相当数量的特定内容。
浏览 2
提问于2022-08-02
得票数 0
2
回答
使用.csv组合
多个
row.names
文件
我有
多个
.csv
文件
(目前为4个,但将来将是可变的),
并
试图将它们导入R(到
单个
数据
帧
中)。
每个
单独的
文件
应用后R中列表的列表count_files <- list.files() co
浏览 0
提问于2021-10-09
得票数 2
回答已采纳
2
回答
读取
文本
文件
,
并
根据第一列中存在的唯一代码将其拆分成
多个
文件
、
读取
文本
文件
并
基于文本
文件
的第一列中存在的唯一代码将
多个
文件
拆分成
多个
文件
-基于第一列中的唯一代码
标识符
,每条记录的列结构将不同。NY", "123", "567", "888" "0666666", "AB", "CC", "DD", "EE", "USA
浏览 26
提问于2019-06-19
得票数 0
1
回答
排列
多个
ggplot2图
、
当我使用gridExtra包的grid.arrange时,随着绘图数量的增加,
每个
单独的绘图都会缩小。有没有一种方法可以创建绘图画布,使其跨越
多个
页面,而不缩小
每个
单独的绘图?也就是说,让它们跨越
多个
页面,
每个
页面将有大约9个左右的绘图?我可以用PNG或PDF
文件
格式。 在尝试grid.arrange之前,我尝试了一下这个站点上的代码示例:,
并
遇到了同样的问题。我还没有尝试将不同的
数据
帧
组合成
一个带有绘图
标识
浏览 1
提问于2011-05-20
得票数 4
回答已采纳
1
回答
创建一个函数来迭代R中大型列表中的tibble元素
、
、
在将
多个
数据
集
组合成
xts之前,我正在尝试创建一个函数来自动执行一些基本的格式化操作。我可以批量
读取
这些
文件
,
并
创建一个很大的tibble列表。但是我很难创建一个遍历该列表的函数。当我将
单个
文件
读入df时,我一直在运行以下程序: df<-df[!我对
数据
的一个问题是,DateTime并不总是在
文件
之间匹配,上面的方法给了我一个带有NAs的大型xts,这是我更喜欢的另一种类型的合并/rbind。我想创建
浏览 14
提问于2020-01-30
得票数 1
回答已采纳
2
回答
从
多个
输入路径
读取
数据
帧
并同时添加列
、
、
我正在尝试
读取
多个
输入路径,
并
根据路径中的日期向
数据
帧
添加两列。实际上,这些
文件
是以orc的形式存储的,使用hive对这些日期进行分区,因此它们具有类似s3n://bucket_name/folder_name/partition1=value1/partition2因此,在这里,我尝试从
多个
路径获取
多个
目录,
并
根据分区为
每个
spark
数据
帧
浏览 1
提问于2018-02-09
得票数 2
回答已采纳
1
回答
如何编写脚本以在
多个
目录中执行
文件
、
如何编写脚本来执行
多个
目录中的
文件
? 问题是:我有许多目录,
每个
目录
都有
一个
数据
文件
,由
python
脚本(例如,a.py)
读取
和分析。我不想"cd“到
每个
目录,
并
键入"a.py”。输出保存在
每个
目录中。
浏览 0
提问于2010-11-05
得票数 4
1
回答
与合并的地板
文件
的Impala表的性能问题
、
、
、
、
这里,我让
python
实用程序使用Pyarrow库为
单个
数据
集创建
多个
parquet
文件
,因为
数据
集的大小在一天内是很大的。这里的拼花
文件
包含10K的拼板行组,在
每个
分割的拼花
文件
中,最后我们将分裂的
文件
组合成
一个
文件
来创建一个大的单一的拼花
文件
。这里,我创建了两个Impala表,其中包含一个合并
文件
和
多个
拆分
文件</e
浏览 0
提问于2019-01-28
得票数 0
回答已采纳
1
回答
如何导入和
读取
大熊猫中的
多个
json
文件
?
、
、
、
我正在尝试使用
python
读取
多个
json
文件
。.json - message1.json - message1.json
如
您所见,所有的json
文件
都有
相同的名称,只是
文件
夹的名称不同。是否有方法
读取
收件箱
并
遍历
每个
文件
夹以获得json
文件
?需要先
读取
路径。如何让程序
读取
浏览 3
提问于2021-10-29
得票数 1
回答已采纳
1
回答
如何在csv中使用多年的for循环创建
数据
帧
、
、
、
我有2015到2019年的
每个
月和年的csv
文件
,正在尝试将它们
读取
到
单个
数据
帧
中,
并
创建一个区分
每个
年份的年份变量,以便我最终可以合并它们。csv
文件
的命名方式都相同(例如: name_monthyear:"name_0119.csv“和"name_0218.csv")。我已经成功地完成了每一年的这一点,通过创建年份
文件
夹2019、2018等,
并
分别完成每一年,然后合
浏览 11
提问于2019-06-23
得票数 0
1
回答
根据能量对生物分子进行分类
我有一个
文件
,里面有7000个分子,以及它们的名字和能量。
每个
分子从关键字模型1开始,第二线有能量(下面的例子是-9.102,第一分子),第七条线有该分子的名称(下面的例子是第一分子,S3670头孢苏林(钠).cdx)。我想根据所有分子的能量对它们进行排序,这样最低的(最负的)分子将是产生的文本
文件
中的第一个分子以及分子的名字。能量和名字可以是相同的,也可以是不同的。
浏览 1
提问于2022-10-21
得票数 0
1
回答
如何使用r中的topicmodel将
多个
文档
组合成
一个文档?
、
、
、
、
我目前正在尝试使用topicmodel包将一个语料库的
多个
文档
组合成
一个文档。我最初通过
多个
csvs导入
数据
,
每个
csvs
都有
多行文本。但是,当我导入
每个
csv时,csv的每一行都被视为一个文档,
每个
csv都被视为一个语料库。我想要做的是将
每个
csv的
每个
文档/行合并为一个文档,然后
每个
csv将代表我的语料库中的一个文档。我不确定这是否可行--也许在最初导入
并
创建文档和语
浏览 17
提问于2020-11-09
得票数 0
回答已采纳
1
回答
NodeJS -
读取
Parquet
文件
、
、
、
有谁知道用NodeJS
读取
拼花
文件
的方法吗?谢谢
浏览 1
提问于2019-04-04
得票数 11
1
回答
使用dask合并
数据
集证明是不成功的
、
、
、
、
我正在尝试使用
Python
中的Dask合并许多大型
数据
集,以避免加载问题。我想将合并后的
文件
另存为.csv。事实证明,这个任务比想象的要难:import dask.dataframe as ddimport os dfs.append(ddf) 如果我使用dd_all.to_csv(
浏览 1
提问于2018-11-15
得票数 0
2
回答
使用多字符分隔符将存储在谷歌云存储上的
数据
加载到BigQuery
、
、
、
我想将带有
多个
字符分隔符的
数据
加载到BigQuery。BQ load命令当前不支持
多个
字符分隔符。它只支持
单个
字符分隔符,
如
'|‘、'$’、'~‘等 我知道有一种
数据
流方法,它将从这些
文件
中
读取
数据
并
写入BigQuery。但是我有大量的小
文件
(
每个
文件
400MB),它们必须写入一个单独的表分区(分区编号在700左右)。这种方法在处理<
浏览 22
提问于2016-08-11
得票数 3
回答已采纳
1
回答
如何将
多个
(excel)
文件
读入R?
、
、
我有上百个中等大小的Excel
文件
(5,000到50.0000行,大约100列)要加载到R中。它们有一个定义良好的命名模式,
如
x_1.xlsx、x_2.xlsx等。如何以最快、最直接的方式将这些
文件
加载到R中?
浏览 0
提问于2015-10-01
得票数 40
回答已采纳
点击加载更多
相关
资讯
Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图
Python绘制台风动图,Python真的无所不能啊!
数据加载、存储与文件格式
Python 文件与目录操作方法总结
总有一款适合你!将Maya相机和对象导出到Nuke
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券