如何根据返回值将列的值用作字典的键来过滤pandas df的行_Pandas df根据字典中与另一列中的行匹配的值来更改一列中的行值_根据表示列和行的位置(坐标)的键，将字典中的值写入.csv - 腾讯云开发者社区

python

你好，我是Python新手，我想把一个.csv文件转换成XML文件。所需的输出应该如下所示，其中我希望在Node：<employee id="5">中有每个单独的ID，以及与彼此下面的每个个体对应的变量，而不是在同一行上： <?xml version="1.0" encoding="UTF-8"?> <Document> <employee id="1"> <Name>Steve</Name> <City>Boston<

浏览 3提问于2016-09-01得票数 0

回答已采纳

1回答

返回Pandas中的DataFrame子集

pandas

我有以下DataFrame： import pandas as pd # create simple dataset of people data = {'Name': ["John", "Anna", "Peter", "Linda"], 'Location': ["New York", "Paris", "Berlin", "London"], 'Age': [24, 13, 53,

浏览 0提问于2017-02-24得票数 1

回答已采纳

1回答

在pandas数据帧中，如何添加一个字段，该字段是具有group by的连续总计

python、pandas、dataframe

我有以下数据帧： import pandas mydata = [{'city': 'London', 'age': 75, 'fdg': 1.78}, {'city': 'Paris', 'age': 22, 'fdg': 1.56}, {'city': 'Paris', 'age': 32, 'fdg': 1.56}, {'city

浏览 0提问于2016-12-22得票数 1

2回答

Pandas，使用序列选择数据帧的子集

pandas

浏览 0提问于2020-01-10得票数 1

2回答

如果dataframe列值与字典键匹配，则检查不同列是否匹配字典值。

pandas、python-2.7、dictionary

我有一个有两列感兴趣的数据。两者都充满了字符串。我还有一个映射键值对的字典，这些键值对也是字符串。我使用字典的键来通过第一列对字典中的键进行数据过滤。最终目标是查找dataframe的第一列，将其与字典中的键匹配，然后确认列2的值与字典的值匹配。对感兴趣的键进行过滤的dataframe正在按预期工作，因此留给我的是两个列组成的数据，其中只有字典中的列键。过滤后的数据数据可以从几行到数千行不等，但是字典的长度是静态的。最后的输出应该是dataframe，其内容显示过滤数据的行，其中第二列的值与字典的值不匹配。 pairs = {'red': 'apple',

浏览 6提问于2020-05-24得票数 5

回答已采纳

2回答

从Pandas DF中删除包含列表中元素的行

python、python-3.x、pandas

假设我有一个DF： students = [ ('jack', 34, 'Sydeny' , 'Australia') , ('Riti', 30, 'Delhi' , 'India' ) , ('Vikas', 31, 'Mumbai' , 'India' ) , ('Neelu', 32, 'Bangalore' , 'India&

浏览 3提问于2020-08-31得票数 0

回答已采纳

1回答

如何在Spark中合并两行？

scala、apache-spark、apache-spark-sql

我需要基于键列"id“合并同一数据帧中的行。在示例数据框架中，1行具有id、name和age的数据。另一行有id、名称和工资。具有相同键'id‘的行必须合并为最终数据帧中的单个记录。如果只有一条记录，也应该用空值Smith和Jake来显示它们，如下例所示。需要对实时数据进行计算，以火花本机函数为基础的解决方案是理想的。我尝试过根据年龄和城市列过滤记录，以分离数据帧，并在ID上执行左连接，但效率不高。寻找其他的建议。提前感谢！样本Dataframe val inputDF= Seq(("100","John", Some(35),None) ,

浏览 4提问于2020-04-05得票数 3

回答已采纳

1回答

在python中使用变量查询或过滤数据集

python、dataframe、filter、pandas-groupby、subset

我在一个项目中使用pandas，该项目使用一个包含21列和近11,000行的数据集。我使用以下代码创建了一个名为name_ten_plus的新变量，该变量显示过滤的列name的计数大于或等于10： name_ten_plus = df_name_data['name'].value_counts()[df_name_data['name'].value_counts() >= 10] 使用print(name_ten_plus)，它显示了至少出现十次的120个name值。print函数产生以下结果(例如)： Mike M 22 John J

浏览 7提问于2020-06-07得票数 0

2回答

Python :在没有重复数据的情况下合并数据帧的多个列

python、pandas、dataframe、merge、duplicates

假设我有这个数据帧： Name = ['Lolo', 'Mike', 'Tobias','Luke','Sam'] Age = [19, 34, 13, 45, 52] Info_1 = ['Tall', 'Large', 'Small', 'Small',''] Info_2 = ['New York', 'Paris', 'Lisbon', '', 'Berli

浏览 6提问于2020-11-12得票数 1

回答已采纳

1回答

如何根据预先制作的列表从熊猫数据中删除行

python、pandas、dataframe

我有一个大数据集。是关于新闻阅读的。我在试着清理它。我创建了一个城市清单，我想保留(这个集合包含了所有的城市)。如何根据该清单删除行？例如，我有一个清单(作为一个列表)，其中包含了所有的法国城市。我怎么才能放弃其他城市呢？要描绘数据帧(我有1.5m行)： City Age 0 Paris 25-34 1 Lyon 45-54 2 Kiev 35-44 3 Berlin 25-34 4 New York 25-34 5 Paris 65+ 6 Toulouse 35-44 7 Nice

浏览 2提问于2022-02-24得票数 0

回答已采纳

2回答

基于多个条件和连接字符串的列分组

python、pandas、group-by

我有以下熊猫DataFrame： import pandas as pd df = pd.DataFrame({ 'name': ['John', 'Jack', 'John', 'Tim', 'John'], 'city': ['New York', 'London', 'Paris', 'Berlin', 'New York'], 'nickname': [&

浏览 6提问于2022-09-11得票数 0

2回答

熊猫在一群人身上绕圈

python、pandas、for-loop、matplotlib、pandas-groupby

我有一个数据集，其中有一个类别字段，“城市”和2个指标，年龄和体重。我想用一个循环为每个城市绘制一个散点图。但是，我很难将我需要的组和循环合并到一个语句中。如果我只使用一个for循环，我就会得到每个记录的图表，如果我按每个记录分组，我就会得到正确的图表数，但是没有值。下面是我的代码，它只使用注释掉的for循环和我的组： import pandas as pd import numpy as np import matplotlib.pylab as plt d = { 'City': pd.Series(['London','New York&#

浏览 1提问于2014-02-15得票数 3

回答已采纳

4回答

从另一个df中找到的数据帧中删除行？

python、pandas、dataframe

我有两个数据帧： df1 = pd.DataFrame({ "name": ["Peter", "John", "Jack", "Mark", "Adam", "Mike", "Aaron", "Mike"], "age": [25, 34, 58, 29, 42, 39, 48, 24], }) df2 = pd.DataFrame({ "name": ["Mark",

浏览 4提问于2021-05-11得票数 1

回答已采纳

1回答

如何正确地从.csv创建XML？

我想从.csv文件创建一个XML文件。要获得所需的结构，我有一些困难： <?xml version="1.0" encoding="UTF-8"?> <document> <employee ID="1"> <Name>Steve</Name> <City>Boston</City> <Age>33</Age> </employee> <employee ID="2"&g

浏览 7提问于2016-08-31得票数 2

回答已采纳

2回答

比较两个数据帧(源与目标)，如果在目标表中未找到记录(具有与源相同的索引号)，则留空行

python、pandas、numpy

想要将dfs“源”中存在的数据与“索引”号与dfs“目标”中的数据进行比较，如果在目标dfs..blank中没有找到搜索到的索引，则必须在目标表中使用与源中给定的相同索引键打印行。是实现无循环的任何其他方法，因为我需要比较500,000条记录的数据集。下面是源数据帧、目标数据帧和预期数据帧。源数据有索引号= 3的记录，而as目标没有索引号= 3的记录。我想用与源文件相同的索引号打印空白行。来源： Index Employee ID Employee Name Age City Country 1 5678 John 30 New york

浏览 11提问于2019-06-13得票数 0

1回答

如何覆盖()从熊猫数据中获取地理坐标？

python、pandas、dataframe

我有以下数据： import pandas as pd df = pd.DataFrame({'City': ['Paris', 'New York', 'Rio'], 'Point': [(48.853638186045075, 2.3164768734228094, 0.0), (40.73149967161843, -73.99345738955843, 0.0),

浏览 3提问于2022-01-05得票数 1

回答已采纳

3回答

Python部分字典到csv的翻译

python、pandas、csv、dictionary、data-conversion

我有一个Python字典，它是这样组织的： { "city": "New York", "zip": "11365", "ages": { "Joe": 25, "Jane": 30, "Taylor": 45 }, "dinner": { "aperitif": "tsikoudia", "appetizer": "edamame

浏览 0提问于2020-10-28得票数 1

3回答

熊猫数据系列:检查是否存在特定值

python、pandas、pandas-groupby

如果来自列表的值存在于熊猫的dataframe列中，我需要迭代列表并执行特定的操作。我试着按下面的方式做，但错误下了 'Error：#系列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()。 import pandas as pd people = { 'fname':['Alex','Jane','John'], 'age':[20,15,25], 'sal':[100,200,300] } df=pd.Data

浏览 0提问于2020-05-20得票数 4

回答已采纳

1回答

在迭代时尝试执行isin时出错

pandas

我有两个数据帧，我试图在一个dataframe的列'name‘中获得第一个值&然后在另一个dataframe的'name’列上使用这个值执行isin。我试图这样做是因为，如果isin是真的，那么我想得到相应的年龄并匹配两者，如果这也是真的，那么就得到相应的City & match。但我得到的错误如下。"TypeError:只有类似列表的对象才允许传递给isin()，您传递了一个str“如果我只打印了”行‘name’，我得到了名字的值，但是为什么它不执行isin检查呢？我在这里错过了什么？ Df1 = pd.DataFrame({'name

浏览 0提问于2019-05-10得票数 0

回答已采纳

2回答

两栏一组，熊猫一栏

pandas

在熊猫中，我想按两栏分组，然后做一次计数。在此之后，我想删除我分组的列，并计算计数的平均值。我知道如何在sql中轻松地做到这一点，但是在Pandas中遇到了一些问题。我不能删除我以前分组的一列。有人知道如何做得好吗？ (只要关心最终结果，如果有更好的结果，程序就不必是这样的) 例： Name, City Anna, New York Carl, New York Carl, New York Steven, London Carl, London Anna, Paris Carl, Paris Carl, Paris 按“名称”和“城市”分组，然后计数： Name, City, Count A

浏览 9提问于2022-10-10得票数 1

回答已采纳