腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
优化
pandas
应用
函数
、
我正在尝试使用此post中的
函数
getKmers def getKmers(sequence, size=6): return [sequence[x:x+size].lower() for我应该
如何
优化
? 我能想到的一种解决方案是将数据集分成几部分,然后迭代地运行这段代码。我认为这是行不通的,因为apply()实际上只是遍历每一行。我不确定这里有什么问题。
浏览 10
提问于2020-09-05
得票数 0
回答已采纳
1
回答
优化
Pandas
应用
函数
、
、
、
、
我有两个
Pandas
DataFrames: pd.Timestamp('2022-01-08')然后,将另一列添加到第一个DataFrame中,通过以下
应用
程序计算1.apply(lamb
浏览 3
提问于2022-04-24
得票数 -2
1
回答
Python :基于条件处理子列表
、
我有一组点(x,y),可以设置为数组或列表。我想计算下几个点之间的距离。然后,我需要对距离之间的进行一些计算,以设置阈值T。然后,我希望处理数组/点列表,以便当距离之间的超过阈值T时,调用传递所有前面点的function_A,然后调用function_B传递当前和前面的点,然后继续针对阈值进行测试。即,如果距离列表1、1.5、2、1.7、7、2、3、8、4阈值计算为7。我希望用对应于1、1.5、2、1.7 function_B的点调用function_A,并对应于1.7和7的点,则下一次超过阈值,即用对应于2、3等的点调用function_A。 需要处理几百点以上,所以我应该使用numpty吗
浏览 1
提问于2021-01-28
得票数 0
0
回答
python
pandas
如何
优化
msSQL 导出到CSV或excel?
、
、
python
pandas
如何
优化
msSQL 导出到CSV或excel?(看到网上很多多少
优化
从csv导出mssql ),实际上导出到csv或excel才更符合实际
应用
浏览 105
提问于2021-11-22
2
回答
如何
在python中动态展开数组?
、
、
、
好的,我有这部分代码: print "Reading Old File! Turn Index = ", turn_index, "SKU= ", SKU array_with_data=[] reading_old_file = open(Path,'rU') d
浏览 1
提问于2014-12-12
得票数 0
回答已采纳
1
回答
Pandas
/ Groupby /
应用
优化
、
、
、
在
pandas
结构中使用重复的cols名称,基本上我正在尝试做与这篇文章相同的事情: 非常感谢。
浏览 18
提问于2020-07-30
得票数 0
1
回答
优化
Pandas
群/
应用
、
to_csv(path, sep=',', index=False)# 3+ hours for ~4m rows 我想知道你是否对
如何
改善这个小进程的运行时间有任何建议
浏览 4
提问于2014-07-08
得票数 0
回答已采纳
1
回答
星火不确定的潘达斯UDF会产生什么问题?
、
、
、
、
import uuid1 from pyspark.sql.functions import PandasUDFType,
pandas
_udf.getOrCreate()df = spark.createDataFrame([["j", 3], ["h", 3], ["a", 2]], ["name", "age"]) @
pandas
_udf我的一个想法是将UDF注册为非确
浏览 1
提问于2020-05-17
得票数 9
1
回答
读取单个数据中的多个csv文件
、
、
、
、
我在一个目录中有很多压缩的csv文件。我想把所有这些文件都放在一个数据文件里。到目前为止,这就是我所做的:for filename in os.listdir(path): temp = pd.read_csv(f, names=col_names)我注意到,上面的代码一开始运行得相当快,但随着读取越来越多的文件,它的运行
浏览 0
提问于2020-01-15
得票数 4
回答已采纳
1
回答
针对ubyte数据(0..255)的python
Pandas
优化
、
、
、
、
如何
将
Pandas
df
优化
为ubyte数据类型(0..255)?(对于整数,默认情况下为int64 ) 如果我将数据转换为分类类型,df会占用更少的内存吗?或者是
优化
它的唯一方法--使用NumPy而不是
Pandas
?
浏览 16
提问于2021-07-01
得票数 0
回答已采纳
1
回答
我可以给熊猫发送一个火花数据作为论据吗?
、
、
、
、
下面是我正在使用的示例代码集,并且在调用
函数
时出错:from pyspark.sql import SparkSession .builder \ .master(df = spark.read.option("header",True)\
浏览 4
提问于2020-11-26
得票数 1
回答已采纳
1
回答
在Pyspark中,当您groupBy与partitionBy中使用的列相同的列时会发生什么?
、
、
现在我正在读回这些数据,并想先调用groupBy('ID'),然后再调用一个
pandas
_udf
函数
。我的问题是,既然数据是由ID分区的,那么groupBy('ID')会比没有分区的数据快吗?
浏览 1
提问于2019-11-07
得票数 0
1
回答
连接后条件下SQL更新的
Pandas
等效项
、
、
我正在尝试将SQL查询翻译成python/
pandas
语言,即根据条件和两个表的内部连接为
pandas
数据帧的某些子集设置新值。table1.colA = table2.colBWHERE table1.colX Is Null;table1.loc[table1[co
浏览 7
提问于2019-11-25
得票数 0
1
回答
使用Dask map_partitions将日期和时间从两列转换为单个datetime列
、
、
、
、
如何
转换此类型的两个日期和时间列:1/01/1990 10553/01/1990 10555/
浏览 3
提问于2020-05-13
得票数 2
1
回答
转置多维表
、
由于这个问题的性质非常大,我使用
pandas
作为主要的数据库API,因为它非常容易将
函数
应用
到列。xxxxx*[
Pandas
::RawTable]*************
浏览 7
提问于2013-03-12
得票数 0
回答已采纳
1
回答
优化
比较DataFrames的
Pandas
函数
、
、
06:27 {'description': 'AuthenticationPanelAdmin'} e2e7565f-60b4-4e7b-a8f0-d0a9c384b283 machine13 此
函数
目标是查看哪个我仍然在学习
如何
最好地使用
pandas
库-我希望使用一些矢量化来
优化
它,但还不能解决
如何
以这种方式构建它。
浏览 6
提问于2018-05-02
得票数 1
1
回答
用于街道地址的字符串拆分
、
、
、
我有856k个模式地址:(在Ave与纽约之间有3个空间)Street, City, State, Zipdef splitAddress(address): ad = address.strip() if(split in ad): addr = ad.split(split)
浏览 0
提问于2017-09-04
得票数 6
回答已采纳
1
回答
有没有办法在groupby中
优化
pandas
应用
函数
?
、
我正在寻找
优化
的代码?我认为
应用
函数
需要时间?有没有更好的
优化
代码?
浏览 18
提问于2019-02-12
得票数 0
回答已采纳
1
回答
使用用户定义的
函数
或向量化的
函数
替代
优化
Groupby.apply()
、
、
、
我正在尝试
优化
或避免
pandas
Groupby.apply()方法,该方法接受我的用户定义
函数
并将其
应用
于每个ID初始数据帧2222 3 2 33333 NAN 2 3 I在ID级别分组,并调用
应用
函数
,该
函数
操作用户定义的
函数</e
浏览 3
提问于2019-07-04
得票数 0
2
回答
python中针对大型交易数据集的市场篮子分析
、
、
、
、
在使用python包对4.2L+行事务数据(以稀疏矩阵的形式)
应用
先验(支持Python0.01)和association_rules
函数
时,频繁项目集和关联规则的生成花费了太多的时间。样本交易稀疏矩阵(
pandas
DataFrame),MBA的输入数据: 3 0 1 0 1 a
浏览 5
提问于2018-10-31
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas库中的函数应用和映射
pandas功能函数总结
盘点一个Pandas中explode()爆炸函数应用实际案例
【Python实战技能】如何用Pandas_函数填充、计算列
Pandas的2 种不同的替换函数
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券