腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
pandas
列
和
字典
高效
地
构建
特性
?
python
、
pandas
、
dataframe
、
machine-learning
、
feature-extraction
我遇到了一个机器学习问题,我正在用
字典
的值计算
pandas
数据帧文本
列
的二元语法Jaccard相似度。目前,我将它们存储为列表,然后将它们转换为
列
。这在生产中被证明是非常慢的。以下是我目前正在遵循的步骤:对于dict中的每个键: 1.获取
pandas
列
和
dictkey的二元语法2.计算Jaccard相似度3.追加到一个空列表4.将该列表存储在dataframe中5.将该列表转换为
列
sim_list.append(n_gram_jaccard_simil
浏览 21
提问于2019-10-06
得票数 1
回答已采纳
1
回答
将任意函数应用于熊猫DataFrameGroupBy对象的有效方法?
python
、
pandas
我有一个“id”
列
和
许多其他
列
的dataframe。对于每个id,我需要
使用
来自相应行的数据来计算许多
特性
。这些
特性
可以是复杂的函数,而不是简单的聚合。优选
地
,应相对有效
地
计算特征,并以透明的方式,即
如何
从数据中计算特征,应在一个地方定义。我会在下面这样做--例如,在
字典
中定义
如何
计算特征,然后
使用
该
字典
和
groupby (可能会并行化group
浏览 1
提问于2022-03-08
得票数 0
回答已采纳
1
回答
Pandas
对整个数据集进行单行过滤-它是
如何
实现的?
python
、
pandas
、
dataframe
我现在正在研究这个奇妙的库,我对过滤,甚至
列
操作是
如何
完成的感到非常困惑,并试图理解这是
pandas
还是python本身的一个
特性
。更准确
地
说: import
pandas
df['Column'] # would display all valueswould display all values from Column greater than
浏览 12
提问于2020-07-01
得票数 1
回答已采纳
1
回答
当行数/
列
数未知时,在DataGridView上
使用
VirtualMode
.net
、
winforms
、
linq
、
performance
、
datagridview
我需要在数据网格中
高效
地
显示具有未知键的未知长度的
字典
序列。此序列是可能较慢的LINQ查询的结果,该查询可能包含任意数量的结果。
使用
VirtualMode可以做到这一点吗?或者,我是否需要估计屏幕上有多少行可见并手动
构建
行/
列
?如果是这样,
浏览 0
提问于2010-05-16
得票数 2
2
回答
Pandas
惯用的将json列表映射到dataframe的方式
python
、
json
、
pandas
我有一个从json输入派生的数据集,我希望将其映射到
pandas
dataframe。
使用
pandas
.DataFrame.from_dict或
pandas
.io.json.json_normalize加载这类
字典
的列表,会产生一个包含两
列
的数据帧: foo
和
bar。df = pd.DataFrame.from_dict([popo] * 10, orient='index') 在一个完美的世界里,我想让df‘’bar‘去引用一个形状为n,3的数组,
浏览 46
提问于2019-03-04
得票数 2
1
回答
是否可以在Windows中压缩与AWS Lambda兼容的文件夹?
python
、
linux
、
windows
、
amazon-web-services
、
aws-lambda
我有一个Catboost模型,我
使用
Python
构建
并持久化(通过pickle),我正在尝试
使用
AWS Lambda部署此模型。我还有另外两个Python脚本可以与我的模型
和
lambda_function.py脚本一起
使用
: functions.py
和
features.py。函数脚本包含解析( JSON )有效负载、生成预测
和
返回JSON对象的函数。功能脚本包含列表、
字典
等,以尽可能
高效
地
进行解析。这些脚本总共有3个
浏览 0
提问于2020-03-20
得票数 1
4
回答
为Scikit提供熊猫数据的矢量法-学习
python
、
pandas
、
scikit-learn
假设我在
Pandas
中有数据,如下所示:A fooC somethingAbar其中行表示实例,列表示输入
特性
(不显示目标标签,但这将用于分类任务),即我试图从
构建
my_dataframe X。
如何
使用
例如有效
地
向量化这一点? 是否需要首先将DataFrame中的每个条目转换为
字典
?(以上链接中的示例就是这样做的)。
浏览 8
提问于2013-11-16
得票数 20
1
回答
群标识
和
唯一
列
值的转移计数
python
、
pandas
eat drink2 B 0 1 1 2 0 我可以用一种
使用
字典
计数器的效率很低的方法来完成这个任务,但是我想知道
如何
使用
Pandas
高效
地
完成这个任务,而不需要创建更小的DataFrames
和
连接。
浏览 0
提问于2016-01-17
得票数 1
回答已采纳
1
回答
如何
将熊猫DataFrame加载到TensorFlow中进行有效的批量训练?
python
、
pandas
、
tensorflow
、
deep-learning
、
tensorflow-datasets
更具体
地
说,我想从该DataFrame加载批量的不同功能组,但我不知道
如何
做到这一点!假设我有由
特性
<code>D0</code>、<code>D1</code>
和
<code>D2</code>组成的DataFrame。>张量,它应该同时表示
特性
<code>D6</code>
和
<code>D7</code>。当然,
浏览 10
提问于2019-12-03
得票数 0
回答已采纳
1
回答
熊猫与科学工具包:切片DataFrame时内存的
使用
python
、
pandas
、
scikit-learn
从这里,我提取了几十个在RandomForestClassifier中
使用
的
特性
:其中一些
特性
只是从数据中的
列
派生出来的,例如: feature2 = data["AnotherColumn"]feature3 =
pandas
.DataFrame,
构建
一棵树需
浏览 2
提问于2012-09-01
得票数 2
回答已采纳
2
回答
比较两
列
中的每个值
python
、
pandas
、
numpy
、
dataframe
如何
比较数据帧中的两
列
,并根据这两
列
的差异
高效
地
创建新
列
? 我的表中有一个有很多缺失值的
特性
,我需要
使用
数据库中包含相同
特性
的其他表来回填这些信息。我已经
使用
np.select比较了我原始表中的功能
和
其他表中的相同功能,但我觉得应该有一个简单的方法。例如:pd.DataFrame({'A': [1,2,3,4,np.nan], 'B':[1,np.nan,30
浏览 24
提问于2019-06-03
得票数 0
回答已采纳
2
回答
将每个单独的
列
设置为具有其自己的数据类型
python
、
python-2.7
、
pandas
、
dataframe
、
types
如何
为每一
列
设置特定的数据类型?对于“系统时间”我想
使用
DateTime,对于“温度”我想
使用
float,因为值有十进制数(例如24.4),而对于“警报”我想
使用
string。
浏览 0
提问于2014-10-26
得票数 0
2
回答
除了索引
和
列
都是字符串外,文件上有许多int
列
的read_csv d类型推断。
python
、
pandas
、
csv
、
types
、
type-inference
我需要为我正在
构建
的推荐程序加载一个大的.csv文件(大约有1000万条记录)。我的输入文件看起来如下(k
列
接近400
列
):ValueError: invalid literal for int() with base 10: 'a' 我猜这是因为我的索引
和
列
是字符串我知道我可以尝试
使用
<em
浏览 2
提问于2017-05-03
得票数 5
2
回答
根据
列
值过滤numpy ndarray (矩阵)
python
、
matrix
、
numpy
这个问题是关于根据某些
列
值过滤NumPy ndarray。第一
列
名为category_code,我需要过滤矩阵,只返回category_code在("A", "B", "C")中的行。结果将需要另一个NumPy ndarray,它的
列
仍然可以通过dtype名称访问。
浏览 2
提问于2012-08-23
得票数 7
回答已采纳
1
回答
添加新行以计算已退出熊猫数据的和平均值。
python
、
python-3.x
、
pandas
、
numpy
、
dataframe
String数组存储名称,
使用
整数数组存储苹果苹果酒(每个售价为5.50美元)的订单数,并
使用
一个整数数组存储苹果汁的订单数(每个售价为4.50美元)。5df = pd.DataFrame(columns="Names“、"Cider”、"Juice“、"Subtotal(Cider)”、"Subtotal(Juice94.5 133.0 0 Paul 0.0 23.0 0
浏览 1
提问于2018-03-14
得票数 2
回答已采纳
2
回答
大型python
字典
。存储、加载
和
写入
python
、
json
、
performance
、
dictionary
、
graph-theory
我有一个很大的python值
字典
(大约50 GB),并将其存储为JSON文件。当涉及到打开文件
和
写入文件时,我遇到了效率问题。我知道您可以
使用
ijson
高效
地
读取文件,但是我
如何
高效
地
对其进行写入呢? 我是否应该
使用
Python
字典
来存储我的数据?python
字典
有多大有限制吗?(
字典
会变得更大)。
浏览 1
提问于2018-12-25
得票数 6
2
回答
在没有循环的情况下从
pandas
数据帧
构建
频率
字典
python
、
python-3.x
、
pandas
、
dataframe
、
bioinformatics
我需要从一个
pandas
系列(来自下面的dataframe中的'amino_acid‘
列
)创建一个频率
字典
,它还为
字典
中的每个条目添加一个相邻的行(来自'templates’
列
)。我
如何
提
高效
率/
使用
最佳实践来实现这一点?sequence_counts: sequence_counts[seq[0]] += seq[1] 我见过下面这样的人,但
浏览 14
提问于2019-06-24
得票数 0
回答已采纳
1
回答
如何
导入2个CSV文件,如果其中一个文件存在于另一个文件中,
如何
比较值,并生成最终的CSV,其中有一
列
表明值是否存在?
python
、
python-3.x
、
csv
我有2个包含这些
列
的csv文件 CSV 2所需的输出将是另一个CSV文件,其中包含来自CSV1的所有
列
,并查看它是否存在于CSV2中。“Exist”
列
将包含1(如果为True )
和
0(如果为False )。有没有办法在不
使用
Pandas
的情况下尽可能
高效
地
完成这项工作?
浏览 11
提问于2021-03-02
得票数 0
1
回答
读取csv并更改'ID‘中的第一个值,然后在python3中写入csv
python
、
export-to-csv
我不知道
如何
更改s= 'Value_ID‘的值。任何帮助都将不胜感激。
浏览 1
提问于2017-06-01
得票数 0
1
回答
你
如何
称呼DynamoDB
和
Cassandra的数据模型?
cassandra
、
amazon-dynamodb
、
scylla
但是,将其称为“键值”数据库完全忽略了DynamoDB的一个极其基本的
特性
,即排序键的
特性
:键有两个部分(分区键
和
排序键),具有相同分区键的项可以按照排序键一起
高效
地
检索。Cassandra还具有完全相同的排序项内部分区
特性
(它称之为“聚类键”),
使用
术语来描述它。然而,虽然这个术语“宽
列
”比“键值”要好,但它还是有点不合适,因为它描述了一个项目可以有大量不相关
列
的更一般的情况--不一定是一个单独项目的排序列表。因此,我的问题是,是否
浏览 3
提问于2020-03-22
得票数 12
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python调整两列数据顺序的方法
Python使用DataFrame打印指定列的方法
Python笔记:Pandas数据处理
Python之Pandas使用教程(一)
肝了3天,整理了90个Pandas案例
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券