腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
列
数组
向
量化
pandas
数据
帧
的
列
查找
、
、
、
我有一个熊猫
数据
框架
的
字符串,如下所示。import
pandas
as pddf = pd.DataFrame(np.random.randint(97,123,size=(3, 4), dtype=我可以在for循环中做到这一点,但是对于一个很大
的
列表,这样做会很慢。有没有办法将其矢
量化
,这样我就可以将col_list作为一个numpy
数组
传递,结果就是一个形状为(len(col_list), len(df.index))
的
n
浏览 22
提问于2019-05-15
得票数 2
回答已采纳
1
回答
向
量化
Python
Pandas
Dataframe
、
、
我有csv文件,我正在将其读入Python
Pandas
Dataframe。我想对操作进行矢
量化
,以便
使用
针对某些
列
的
一组用户定义函数对
列
运行
数据
清理,并将结果附加到
数据
帧
中。我可以读取记录并逐个处理它们,但我想通过
Pandas
使用
一个函数对1整列进行操作来向
量化
操作。输入
数据
帧
0 a b c
浏览 3
提问于2019-11-01
得票数 1
1
回答
Pandas
-
使用
列表
的
列作为键来创建其他
列
、
、
我有一个列为"team_name“
的
数据
帧
"df1”。我有一个不同
的
数据
帧
"df2“,有两
列
:"city”作为字符串,"teams“作为列表。我想在df1中创建一个名为"team_city“
的
新
列
,通过
查找
"teams”
列
中列表包含“team_name”
的
行,可以在df2
的
" city
浏览 14
提问于2021-07-09
得票数 0
1
回答
在单独列表中对
Pandas
数据
帧
列
值进行矢
量化
查找
、
、
、
、
我正在寻找一种
使用
Pandas
数据
帧
内容执行计算
的
快速(矢
量化
)方法。我
的
dataframe每行包含2个标签,我希望
查找
与每个标签对应
的
值(从字典/列表),并执行计算,将结果返回到dataframe中
的
新
列
。 new_col
浏览 2
提问于2018-02-18
得票数 3
回答已采纳
2
回答
如何在
pandas
中
使用
向
量化
而不是for循环
、
、
、
、
我正在尝试为我
的
工作建立一个机器学习算法。我用于训练和测试
的
数据
有17k行和20
列
。我试着在另外两个
列
的
基础上添加一个新
列
,但是我编写
的
for循环太慢了(需要3秒才能执行) for i in range(0, len(model_olculeri)): model_olculeri["W
浏览 59
提问于2021-10-25
得票数 0
回答已采纳
1
回答
如何将函数应用于两
列
Pandas
数据
帧
和两个if函数
、
、
、
我想创建一个基于收缩压和舒张压
的
类。我有一个包含Systolic和Diastolic
列
的
df。我定义了一个函数: f = lambda x, y : my_function_expression.现在,我想将f应用于df
的
两个
列
Systolic和Diastolic to,以便在新
列
Blood_Pressure上创建一个类,类似于: df['Blood_Pressure'] = df['Systolic我想要
的
结果示例: ?
浏览 10
提问于2020-10-21
得票数 3
2
回答
如何避免这个python脚本中
的
for循环
、
、
、
我正在做一些
数据
分析任务,
使用
这个python脚本我可以得到我想要
的
结果,但是它非常慢,可能是由于for循环,我必须处理数百万
的
数据
行,有什么方法可以把这个脚本改得更快吗?
浏览 0
提问于2019-11-04
得票数 1
1
回答
在Python中高效地按ID计数ngram
、
我希望在我
的
dataframe中创建10,000个新
列
,每个
列
都包含相关ngram
的
计数。我当前
的
解决方案包括
使用
文本遍历
数据
帧
中
的
列
,
使用
re.findall计算ngram在每一行中出现
的
次数,将findall方法
的
长度放在一个列表中,然后
使用
该列表在
数据
帧
中创建新
列
。由于内存限制,我一次只
浏览 0
提问于2020-05-20
得票数 0
1
回答
我无法根据3个条件(检查其他3
列
中
的
值)正确地为df行分配值。
、
、
我试图将比例值赋值给df中特定行中
的
列
。每一行代表一个特定月份
的
唯一产品销售额,如下面所示
的
数据
格式(称为testingAgain):现在我想找出那个独特
的
产品月
的
销售额与家庭月销售额
的
比例。&(testingAgain['Month']==month)
浏览 2
提问于2020-08-26
得票数 0
回答已采纳
2
回答
python中
的
蒙特卡罗模拟-带循环
的
问题
、
、
我正在为MC运行一个简单
的
python脚本。基本上,它读取
数据
帧
中
的
每一行,并选择两个变量
的
最大值和最小值。然后,模拟if运行1000次,在最小值和最大值之间选择一个随机值,并计算乘积并将P50值写回
数据
表。import random data = [[0.075,0.085, 120
浏览 0
提问于2019-08-24
得票数 0
2
回答
在
pandas
数据
帧
中插入sklearn CountVectorizer
的
结果
、
、
、
我有一堆14784个文本文档,我正在尝试对它们进行矢
量化
,这样我就可以运行一些分析。我
使用
sklearn中
的
CountVectorizer将文档转换为特征向量。我这样做是通过调用:features = vectorizer.fit_transform(examples) 其中examples是所有文本文档
的
数组
现在,我正在尝试
使用
其他功能。为此,我将这些特性存储在一个
pandas
数据
帧
浏览 0
提问于2016-11-02
得票数 14
1
回答
如何从TensorFlow/OpenCV对象检测检测到
的
每个对象触发JSON或pd Dataframe报告
、
、
、
、
我正在构建一个python应用程序,它
使用
AI来扫描OpenCV
的
实时提要,并跟踪带或不带面具的人。我想问,是否有一种好方法可以为提要中跟踪
的
每个唯一实体发送唯一
的
数据
帧
,以便在
数据
库中创建每个人进入
帧
时被跟踪
的
程序性条目,以及他们是否戴着口罩。 有什么建议吗?
浏览 15
提问于2021-04-26
得票数 0
1
回答
将data.frame
的
所有
数组
列
改为列表
、
、
我
使用
dplyr,它要求所有
数据
帧
或tibble
列
都是1d原子向量或列表。但有时我有包含数字
数组
列
的
数据
帧
,如下所示:y= matrix(c(1,2,3, 11,12,13, 20,21,22, 23,24,25)如何将所有非原子
列
转换为列表?下面是转换一
列
的
非矢
量化
方法,但我更喜欢矢
量化<
浏览 1
提问于2018-08-01
得票数 0
回答已采纳
1
回答
Databricks:如何将行
的
值转换为
数组
类型
、
假设我有下面的
数据
帧
col1 a b c有什么想法吗?
浏览 16
提问于2019-11-07
得票数 0
1
回答
在列表
的
pandas
列
中添加特定列表元素
、
我有一个
pandas
数据
框架,其中一
列
由列表组成:df = pd.DataFrame({"a" : [[1,2,3], [4,5,6], [7,8,9]]})我想添加,例如,每个列表
的
第一个和最后一个索引。为此,我
使用
apply这将单独作用于每一行,如果
数据
帧
很大,这可能会非常密集。有没有一种方
浏览 0
提问于2019-11-18
得票数 1
2
回答
向
dask.dataframe添加dask.array
列
、
、
我有一个dask
数据
帧
和一个dask
数组
,它们以相同
的
逻辑顺序具有相同
的
行数。
数据
帧
行通过字符串进行索引。我正在尝试将一个
数组
列
添加到
数据
帧
中。我尝试了几种方法,但都以其特定
的
方式失败了。当结构在逻辑上兼容时,将dask
数组
列
添加到dask
数据
帧
的
正确方法是什么?
浏览 15
提问于2018-01-09
得票数 8
1
回答
使用
矢
量化
在
pandas
中创建
列
、
我正尝试在一个
pandas
数据
帧
上
使用
矢
量化
来创建一个新
列
。
数据
帧
相当庞大(数百万条记录)。我在这里展示了一个虚拟
的
例子。我展示了一个非矢
量化
的
版本,它可以工作,但效率不是很高。我试图在
使用
函数
的
同时实现矢
量化
版本(实际
的
函数比这里显示
的
函数要复杂得多)。import
pandas
as pd
浏览 4
提问于2018-08-31
得票数 0
2
回答
向
数据
框
列
插入值
、
、
我有一个熊猫
数据
框0 173.0 147.0 161 162.0我只想增加一个
列
的
值,比如因为文件可以包含任意长度
的
列
,而我不知道loc和iloc。因此,我只想给列增加值。提前谢谢。
浏览 0
提问于2018-07-24
得票数 3
回答已采纳
1
回答
具有重置条件
的
累积和
、
您好,我有一个
数据
帧
,我想在
列
的
累积和等于某个阈值时
查找
索引。然后,它将重置并再次启动cumsum。85 1 97 -1 89 2 11 因此,在上面的示例
数据
中,data1是第1
列
的
累加和。如果我设置为thres=5,这意味着只要第1
列
的
运行和大于或等于5,我就会保存索引。在此之后,
浏览 15
提问于2019-03-20
得票数 2
1
回答
空值
的
Python
Pandas
推算
、
、
我试图用一个偏移量来计算Null值,该偏移量对应于行dfrow
的
平均值、'avg‘和
列
的
平均值('imputecol')。有没有办法让这个方法与.map并行化?或者有没有更好
的
方法来遍历包含Null值
的
索引?
浏览 12
提问于2017-06-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券