腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
减少
这种
pandas
数据
帧
连接
代码
、
、
0 locatedIn NEWYORK USA 1 nationality HOMMER USA } 每个组件对应的实例是一个
pandas
数据
帧
,有三列。并将每个
数据
帧
的公共变量X(subj)与一个键
连接
,以获得('#1','X','Y'),('#2','X','Z')的实例。 下面是我的
代码
。p
浏览 11
提问于2021-05-11
得票数 0
回答已采纳
3
回答
在Jupyter Notebook上使用Python创建
数据
库
、
、
、
、
因此,我正在为一个较大的程序构建一个
数据
库,并且在该编码领域(主要是嵌入式系统编程)方面没有太多经验。我的任务是把一个大的excel文件导入到python中。
浏览 34
提问于2018-09-01
得票数 0
2
回答
高效地为自定义DataSets创建类标签(HuggingFace)
、
、
我有熊猫的
数据
-测试和训练,它们都有text和label列,如下所示- fear ignition problems will appear 与往常一样,要从HuggingFace运行任何Transformers模型,我将将这些
数据
转换为Dataset类,并创建classLabels (fear=0,joy=1),如下所示- traindts = Dataset.from_
pandas
浏览 0
提问于2022-08-07
得票数 0
回答已采纳
2
回答
优化PySpark与
pandas
DataFrames之间的转换
、
、
、
、
我有一个13M行的pyspark
数据
帧
,我想把它转换成
pandas
数据
帧
。然后,将根据其他参数以不同的频率(例如1秒、1分钟、10分钟)对
数据
帧
进行重新采样以进行进一步分析。从文献[,]中,我发现使用以下任何一行都可以加快pyspark到
pandas
数据
帧
之间的转换: spark.conf.set("spark.sql.execution.arrow.pyspark.enabled", "
浏览 11
提问于2021-11-19
得票数 0
3
回答
如何
在python中组合csv
数据
、
、
、
我有两个CSV文件,我想将它们合并到一个文件中。我的第一个CSV文件名为vector_train.csv,第二个名为label_train.csvv1,v2,v3,v10055,72,45,90 sentence,labelgood voice,1vector_train.csv12,32,15,30,0请帮帮我
浏览 24
提问于2019-07-10
得票数 1
回答已采纳
2
回答
Spark -
如何
在列的基础上以最小的混洗重新划分
数据
帧
?
、
我们有多个
数据
帧
。 其中一个
数据
帧
是主
数据
帧
,它使用左-外
连接
与其他
数据
帧
连接
。所有这些
数据
帧
都
连接
在4列上(比如col1、col2、col3、col4)。为了
减少
数据
混洗,目前我们正在对4个
连接
列上的所有
数据
帧
进行重新分区,然后
连接
这些
数据</em
浏览 2
提问于2019-02-08
得票数 2
1
回答
Pandas
和HDF5中的文件大小缩减
、
、
、
、
我正在运行一个模型,该模型将
数据
输出到多个
Pandas
框架中,然后将这些
帧
保存到HDF5文件中。该模型运行数百次,每次在现有HDF5文件的框架中添加新列(多索引)。这是用
Pandas
merge完成的。由于每次运行的
帧
都有不同的长度,因此在
帧
中最终会出现大量的NaN值。 完成足够的模型运行后,如果行或列与出现错误的模型运行相关联,则从框架中删除
数据
。在这个过程中,新的
数据
帧
被放入一个新的HDF5文件中。我的问题是,
如何</em
浏览 3
提问于2015-10-28
得票数 2
回答已采纳
1
回答
循环遍历分组的spark
数据
帧
中的每一行,并解析为函数
、
、
、
"user").distinct().collect()]但是我不清楚
如何
使用这个
浏览 3
提问于2021-04-20
得票数 1
1
回答
有没有办法像Pyspark那样将大熊猫
数据
保存在多个(parquet/csv)文件中?
、
、
我有很大的
pandas
数据
帧
,我需要将它保存到多个(parquet/csv)文件中,以
减少
文件的卷空间。我可以通过将
数据
帧
划分为多个
数据
帧
并分别保存每个
数据
帧
来进行划分 有没有方法可以直接做到这一点呢?
浏览 28
提问于2020-01-16
得票数 2
回答已采纳
1
回答
如何
在databricks中将
数据
帧
结果保存到表中?
、
、
我已经尝试了下面的
代码
,但它总是给我一个错误,或者我确实运行了,但我看不到
数据
库中的表 myWords_External=[['this', 'is', 'my', 'world'],['this',
浏览 16
提问于2019-09-07
得票数 0
2
回答
基于条件创建新列
、
、
我可以简单地使用左
连接
,但问题是可能有两到三个权重分配给相同的ID ID START END2711413129 2018-11-12 20:00:00 2018-11-13 04:20:59 4.8 我正在使用下面的
代码
浏览 0
提问于2019-08-20
得票数 1
1
回答
如何
通过for循环中的for循环将列表附加到dataframe
、
、
、
、
收集到
数据
后,我要求
代码
将
数据
存储在
数据
帧
中。这工作得很好,但我在创建一次又一次追加
数据
帧
的方法时遇到了麻烦,这样我就只剩下一个大的
数据
帧
了。有人能帮上忙吗?请注意,API
连接
允许一定数量的调用pr。请参考下面的
代码
: C20 = 'AMBU-B.CPH','MAERSK-B.CPH‘ df = pd.DataFrame() def getdata(symbol_inp
浏览 19
提问于2020-01-08
得票数 1
1
回答
熊猫列表达式和if else
、
、
、
我正以
这种
方式在Python
pandas
中创建一个字符串表达式。df['ABC'] = (df['A'] + ' + ' + df['C'])TypeError: cannot concatenate 'str' and 'float' obj
浏览 3
提问于2014-07-11
得票数 1
回答已采纳
2
回答
将
数据
从Python导出到excel工作表
、
、
经过几次研究,我无法正确地将抓取的
数据
导出到excel工作表中……from selenium import webdriverfrom selenium.webdriver import ActionChainsfrom time import sleep df.to_excel('EXTRACTION.xlsx', i
浏览 21
提问于2021-05-17
得票数 0
1
回答
在python中将多个.csv合并为一个csv
、
、
、
、
到目前为止,我产生了这样的结果: import osimport
pandas
as pd extension = 'csv'现在
如何
在"timestamp“列上合并它们?我已经尝试过concate和merge,但它总是将它们放在一个列中。
浏览 37
提问于2020-08-05
得票数 0
回答已采纳
1
回答
使用列表中的名称创建
数据
帧
、
、
、
、
我想把它们都
连接
起来,一次一个制表符。(files[0]).sheet_names 现在,假设我的标签是alpha,beta,gamma等,我想创建一个
数据
帧
df_alpha,df_beta等的列表,它们是中文件的所有alpha标签的并集。通过执行以下操作: for sheet in sheets: for f in files: df =
pandas
.concat([df,
pandas
.read_exc
浏览 15
提问于2021-04-14
得票数 3
回答已采纳
1
回答
如何
在函数开头的样式中呈现
数据
帧
?
使用jupyter notebook,这段
代码
import
pandas
as pd import
pandas
as pd print(df) prepare() 我以
这种
方式获取<
浏览 10
提问于2021-07-10
得票数 0
1
回答
将表格
数据
排序到Quintile/Deciles中
我正在努力将我的
数据
表排序为五分表/十分表等。我只是在使用一些状态
数据
进行练习,因为我是新手和学习者。到目前为止,这是我的
代码
。但是我试着用这段
代码
来查找五分图。 tablepolice_shootings_per_million.quantile(0.2) 我得到了这个错误。
浏览 12
提问于2020-06-16
得票数 0
3
回答
减少
Pandas
中的
数据
帧
大小
、
、
、
我希望将我的
pandas
数据
帧
(df)
减少
到Python 2.7中的前2个值。目前,我的
数据
框架如下: test_number result Count21947result Count21947 140063 <9.0 1556 我不想限制输出,而是<em
浏览 5
提问于2016-12-06
得票数 1
回答已采纳
1
回答
dask读取具有不同模式的多个拼图文件
、
、
、
、
我想用dask将具有不同方案的多个拼图文件读取到
pandas
dataframe,并能够合并这些方案。
浏览 40
提问于2019-09-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分析神器Pandas:如何用1行Python代码挖掘数据?
如何通过代码连接SQL Server数据库
pandas系列学习(五):数据连接
这样做能让你的 pandas 循环加快 71803 倍
如何只用一行代码让 Pandas 加速四倍?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券