如何将列名映射到新的dataframe并用新值替换它 - 腾讯云开发者社区

、、

我有一本看上去像{1: 'Film & Animation', 2: 'Autos & Vehicles', ....... 10: 'Music'}的字典我有一个dataframe，列名为Name Address 1 2 3 ..... 如何将dataframe列名更改为字典中的相应值？ {1：“电影和动画”、2：“汽车和车辆”、10：“音乐”、15：“宠物和动物”、17：“体育”、18：“短片”、19：“旅行和活动”、20：“游戏”、21：“视频日志”、22：“人物和博客”、23：“喜剧”、24：“娱乐”、25：“新

浏览 3提问于2020-05-07得票数 0

回答已采纳

1回答

当熊猫列重命名创建列名重复时，该怎么办？

、

如果新列名已经存在，那么当我重命名列时，为什么pandas.DataFrame对象不抱怨呢？这使得将来引用新列时返回pandas.DataFrame而不是pandas.Series，这可能会导致进一步的错误。第二，是否有办法处理这种情况？示例： import pandas df = pd.DataFrame( {'A' : ['foo','bar'] ,'B' : ['bar','foo'] } ) df.B.map( {'bar':'foo','f

浏览 2提问于2015-05-29得票数 0

回答已采纳

2回答

Danfo dataFrame -按索引、列替换值

、、

在python中的python中，用列和索引来替换值非常简单。示例DataFrame： df = pd.DataFrame({'A': [1, 2, 3], 'B': [200, 300, 400]}) A B 0 1 200 1 2 300 2 3 400 替换值就像下面这样简单： df['A'][0] = 800 A B 0 800 200 1 2 300 2 3 400 如何在Danfo DataFrame中按列和索引替换值？

浏览 6提问于2021-02-24得票数 1

3回答

设置pandas DataFrame的索引名称

、、、

我有一个像这样的熊猫数据框架： '' count sugar 420 milk 108 vanilla 450 ... 第一列没有标题，我想给它起个名字：‘配料’。我从csv文件创建了数据帧： df = pd.read_csv('./data/file_name.csv', index_col=False, encoding="ISO-8859-1") df = df['ingredient_group'] #selecting column df = df.value_cou

浏览 10提问于2016-06-22得票数 35

回答已采纳

2回答

如何更新星火数据帧的单元格

、

下面有一个dataFrame，我试图根据某些条件更新一个单元格(比如sql，其中.) 例如，假设我有以下数据框架： +-------+-------+ |datas |isExist| +-------+-------+ | AA | x | | BB | x | | CC | O | | CC | O | | DD | O | | AA | x | | AA | x | | AA | O | | AA | O | +-------+-------+ 当和isExis

浏览 2提问于2019-12-04得票数 1

回答已采纳

3回答

附加不同列名的数据格式. Pandas

、、、、

我有3个数据文件，可以从下面显示的代码中生成 df1= pd.DataFrame({'person_id':[1,2,3],'gender': ['Male','Female','Not disclosed'],'ethn': ['Chinese','Indian','European']}) df2= pd.DataFrame({'pers_id':[4,5,6],'gen': ['Male','

浏览 3提问于2019-07-29得票数 2

回答已采纳

1回答

Dataframe迭代--更好的价值分配实践

、、

我想知道如何做更干净的代码，所以我开始关注我的一些日常代码例程。我经常需要迭代一个dataframe来更新一个dicts列表： foo = [] for index, row in df.iterrows(): bar = {} bar['foobar0'] = row['foobar0'] bar['foobar1'] = row['foobar1'] foo.append(bar) 我认为这很难维护，因为如果更改了df键，那么循环就不能工作了。此外，为两个数据结构

浏览 0提问于2018-06-28得票数 0

回答已采纳

1回答

检查df1中的字符串是否存在于df2中的任何位置，并在df1中返回匹配的列名

、、

我正在尝试检查两个dataframes之间的字符串匹配，并返回匹配所在的列的名称。我需要包括在一个精确的匹配中找到的所有匹配，在df1中作为一个列表返回。 My Dataframes df1 (数据查找在标题列中) title counts 0 nike 3 1 adidas 2 2 rebok 2 df2 (内搜索匹配数据) 0 1 2 0 nike adidas rebok 1 nike rebok hitech 2 converse

浏览 2提问于2022-09-25得票数 2

回答已采纳

2回答

Pyspark:从中移除UTF空字符

、、、、

我有一个类似于以下内容的： df = sql_context.createDataFrame([ Row(a=3, b=[4,5,6],c=[10,11,12], d='bar', e='utf friendly'), Row(a=2, b=[1,2,3],c=[7,8,9], d='foo', e=u'ab\u0000the') ]) 其中列e的一个值包含UTF空字符\u0000。如果我试图将此df加载到postgresql数据库中，则会得到以下错误： ERROR: invalid byte sequence for

浏览 2提问于2016-12-14得票数 5

回答已采纳

9回答

如何在朱莉娅(版本0.3) DataFrame中更改多个列名？

例如，假设您创建了一个类似于这样的朱莉娅DataFrame，其中有20列： y=convert(DataFrame, randn(10,20)) 如何将列名(:x1 ... :x20)转换为其他东西，例如(:col1, ..., :col20)，一次又一次？

浏览 14提问于2014-02-04得票数 22

回答已采纳

1回答

将列值转换为标题pandas

、、

我的pandas DataFrame格式如下 |Header|Text | |------|-------| | AB |yale | | BC |grass | | BC |window | | AB |school | | BC |student| 我的期望是将该DataFrame转换为以下格式 | AB | BC | |------|-------| | yale | grass | | yale | window| |school|student| 到目前为止，我似乎找不到一种方法来获得预期的格式。我需要帮助。

浏览 17提问于2021-04-07得票数 1

回答已采纳

1回答

在R函数中，如何将名字与_parameter1、parameter2联系起来成为name_parameter1？

、

在有参数名的地方，我有函数测试。我希望将“添加”名称添加到列加上参数，如下所示： test <- function(name, dataframe) { dataframe$name_parameter1 = 5 dataframe$name_parameter2 = 4 } 如何将名称与_parameter1、_parameter2等相结合？使它成为name_parameter1等。 (注册商标)

浏览 3提问于2017-09-25得票数 0

回答已采纳

2回答

如何键入星火DataFrame列？使用火花放电

、

我以以下方式创建了一个DataFrame： from pyspark.sql import SparkSession spark = SparkSession \ .builder \ .appName("Python Spark SQL basic example") \ .getOrCreate() df = spark.read.csv("train.csv", header=True) 我的DataFrame的架构如下： root |-- PassengerId: string (nullable = true) |-- S

浏览 3提问于2018-10-18得票数 0

回答已采纳

2回答

将每个组的第一个元素替换为其聚合函数

、

假设以下数据文件： df = pd.DataFrame( {'X': ['a', 'a', 'b', 'a', 'b'], 'Y': [2, 4, 8, 10, 5]}) 它看起来是： X Y 0 a 2 1 a 4 2 b 8 3 a 10 4 b 5 如何将每个组的第一个元素用X替换成相应的平均值？预期产出： X Y 0 a 5.33 1 a 4.00 2 b 6.50 3

浏览 7提问于2022-08-11得票数 3

回答已采纳

3回答

JDBC查询中使用表名作为参数的安全方法

、、、

如何将表名作为参数放入SQL查询中，安全的方法是什么？不能使用将表名作为参数。可以使用使用动态表名来执行查询，但不建议使用该字符串来执行查询，因为它存在注入SQL的风险。做这件事的最佳方法是什么？

浏览 3提问于2016-10-06得票数 6

回答已采纳

1回答

重命名列并将缺少的列添加到数据帧

、

背景：我有一个dataframe，它有一个列，看起来像这样： >>> merge_df['AAChange'] 0 STK11:NM_000455:exon1:c.148_149TG Name: AAChange, dtype: object 我需要在“：”字符上将其拆分成单独的列，如下所示： >>> new_cols = merge_df['AAChange'].str.split(':').apply(pd.Series,1) >>> new_cols 0

浏览 1提问于2016-12-10得票数 1

1回答

熊猫填充DataFrame值

、、

因此，对于文档，fillna value参数可以是以下之一： value : scalar, dict, Series, or DataFrame Value to use to fill holes (e.g. 0), alternately a dict/Series/DataFrame of values specifying which value to use for each index (for a Series) or column (for a DataFrame). (values not in the dict/Series/DataFrame will not be f

浏览 2提问于2017-07-04得票数 1

1回答

删除elasticsearch中的嵌套数组

、、

我有包含以下格式嵌套表的文档： { "dataId": "dataIdentifier", "versionId": "versionIdentifier", "items": [ { "obj1": "value1", "obj2": "value2", "obj3": "value3", }, { "obj1": "value4", "obj2": "val

浏览 0提问于2019-01-11得票数 0

1回答

我已经删除了rubygems.org源代码，但仍在使用它

、

我已经用gem sources -r 删除了源代码。但是当我运行helios new sample时，它仍然使用rubygems.org源代码，而不是我添加的ruby.taobao.org源代码。如何将helios命令设置为使用这个唯一可用的gem源代码来安装其他gem？

浏览 4提问于2013-07-31得票数 0

1回答

在考虑到缺失值的情况下，添加两列不同的数据格式

、、

如何添加两个数据格式(A + B)的列，以便结果(C)考虑缺少的值(‘-’)？ DataFrame A a = pd.DataFrame({'A': [1, 2, 3, '---', 5]}) A 0 1 1 2 2 3 3 --- 4 5 DataFrame B b = pd.DataFrame({'B': [3, 4, 5, 6, '---']}) B 0 3 1 4 2 5 3 6 4 --- A+B的期望结果 C 0 4 1 6 2 8 3

浏览 0提问于2019-04-11得票数 1

回答已采纳

3回答

使用一个DF上的行作为另一个DF中的新列名

我想用另一个DF中行中的名称替换DF的一些列名 import pandas as pd df1=pd.DataFrame({'T2': [2,3], 'T1': [4,5], 'HO': [2,7] }) df2=pd.DataFrame({'T1' : ['cat'], 'T2' :['dog'] }) 如何将df1中的'T1‘和'T2’替换为df2中的

浏览 39提问于2019-04-13得票数 1

回答已采纳

1回答

有没有办法在tableau中为工作表和仪表板创建模板？

、

我需要创建一些基于部门指标的可视化，以显示项目的季度进度。我可以上传excel文件和开发我需要的。我的问题是，如何将这些工作表和仪表板保存在某种模板中，以便在向excel文件(当前季度进度)中输入更多数据时，我可以将修订后的excel文件上传回Tableau，并使用相同的工作表和仪表板来显示更新后的数据？ excel文件中的列没有更改，我们只是在项目通过里程碑时添加额外的数据行或更新现有列中的日期。我正在使用Tableau Desktop 2019.4.3 我对使用Tableau非常陌生，并期待着学习更多。我希望我的问题有意义，并感谢任何反馈。

浏览 17提问于2021-01-13得票数 1

2回答

我怎样才能用熊猫的零填充空的数据呢？菲尔纳

、

进程正在创建一个dataframe，有时该进程返回一个没有值的空dataframe。在这种情况下，我希望对所有列使用零填充dataframe。我试过output_df.fillna(value=0, inplace=True)，但它不起作用。数据仍然是空的。

浏览 5提问于2022-03-03得票数 0

1回答

熊猫将数据与学生成绩与历史分数进行比较

、

我有两张数据。一种是在两个测试中按班级显示学生的考试结果。 import pandas as pd results = pd.DataFrame({ 'id':[1,2,3], 'class':[1,1,2], 'test_1':[0.67,0.88,0.33], 'test_2':[0.76,0.63,0.78]}) results id class test\_1 test\_2 0 1 1 0.67 0.76 1 2 1 0

浏览 0提问于2019-08-15得票数 3

回答已采纳

1回答

如何使用Xposed重定向.so库在安卓中的加载？

、、

我有一个包含库的应用程序(例如，"test.so")，我想将该.so的加载重定向到另一个由我修改的"test.so“，我尝试了所有使用Xposed的方法，如下所示： public class xposed implements IXposedHookLoadPackage { public void handleLoadPackage(final LoadPackageParam lpparam) throws Throwable { if (lpparam.packageName.equals("package")) {

浏览 50提问于2019-08-25得票数 1

回答已采纳

1回答

如何根据矩阵中的名称而不是数字索引来重命名特定的冒号？

、、

我有很多来自不同网站的数据。因此，我想重命名选择变量名的colnames，而不是矩阵中的数字位置。这里有一个关于一个站点的矩阵的想法： mdat <- matrix(c(rnorm(5,100), rnorm(5, 15), rnorm(5, 0.5), rnorm(5,0.1), rnorm(5,40)), nrow = 5, ncol = 5, byrow = F, dimnames = list(c(2011:2015), c("Pre", "Temp", "Magnesium", "Zinc&

浏览 5提问于2015-08-18得票数 2

回答已采纳

1回答

如何将字符串从一个dataframe组合成一个？

、

我有一个名为“果树”的dataframe列，其中包含5个唯一的字符串，它们在.CSV文件中的行中多次出现:红苹果、橙、梨、葡萄、绿苹果。使用lambda或map，我如何将红苹果和绿苹果组合在一起，以便Python将它们识别为相同的？基本上把它从5变成4根独特的弦:苹果，橘子，梨，葡萄。我之所以需要这样做，是因为当我尝试这一行时： Df = pd.get_dummies(Df, drop_first=True) 我遇到了一个“虚拟变量陷阱”的问题，在我用sns.heatmap创建的用于线性回归的关联热图中，我的一条独特的字符串(红苹果)没有被识别。如果有比兰达或地图更好的方法，我也对此持开

浏览 5提问于2021-12-06得票数 0

2回答

如何编写一个星火数据中心到Azure事件中心？

、、

我需要用脚本编写一个DataFrame到Azure事件中心。我的解决方案基于本文。如何将具有多列的Dataframe转换为具有名为“body”的单一列的DataFrame，并将所有列作为json？我正在使用Scala和Spark 3 下面是我找到的一个解决方案，toJson在其中创建了一个名为“value”的列。 df.toJSON.selectExpr("value as body") 谢谢。

浏览 8提问于2022-01-11得票数 0

3回答

如何更改Pandas DataFrame的列名？

、、

我有一个有n列的Pandas DataFrame，不知道会有多少列。 df = index task_1 task_2 ...... 0 dummy_1 dummy_2 .... 1 dum_1 dum_2 ... 我希望将列名从task_1更改为Label_1，因此on.The out需要 df = index Label_1 Label_2 ...... 0 dummy_1 dummy_2 .... 1 dum_1 dum_2

浏览 2提问于2021-06-09得票数 2

回答已采纳

2回答

用数字增量替换熊猫列值

、

import pandas as pd data = {'Account':['Paul','Jenn']} df = pd.DataFrame(data=data) 对于paul和Jenn，需要的输出分别是1和2，解决方案的基础是为一个更大的数据集形成一个for循环，用数字值替换帐号名。

浏览 7提问于2022-06-14得票数 0

2回答

将滑块箭头转换为点滑块

、、

我想知道如何将滑块上的箭头改为底部的圆点。以下是箭头的当前代码： <div class="home-slide-arrows"> <div class="home-slide-prev"><div class="inner"></div></div> <div class="home-slide-next"><div class="inner"></div></div> </div>

浏览 3提问于2015-06-03得票数 1

2回答

在数据帧上使用熊猫的再索引方法时，为什么原始值会丢失？

、、、

这是原始的Dataframetols：我想要的:，我想把上面的数据帧转换成这个多索引的列数据框架：我通过这段代码成功地做到了这一点： # tols : original dataframe cols = pd.MultiIndex.from_product([['A','B'],['Y','X'] ['P','Q']]) tols.set_axis(cols, axis = 1, inplace = False) 我尝试了什么:，我尝试用reindex方法这样做： cols = pd

浏览 1提问于2019-08-27得票数 2

回答已采纳

1回答

Pandas -获取某些未指定的上一行/下一行的值

、

我有一个DataFrame的例子： import pandas as pd import numpy as np df = pd.DataFrame( {"col1": ["A", "B", "C", "D", "E", "A", "E", "B", "D"], "col2": [1, np.NAN, 3, 4, np.NAN, 6, np.NAN, np.NAN, 8], }) Id col

浏览 12提问于2020-02-28得票数 1

回答已采纳

2回答

pandas创建了另一个df的唯一值表

、、

我正在尝试创建一个包含给定DataFrame的所有不同值的表(之后在LaTex中打印它)： dfDiff = pd.DataFrame(columns=df2.columns) for col in df2: dfDiff[col]=(df2[col].unique()) 我收到以下错误消息： ValueError: Length of values does not match length of index 有没有更好的方法呢？

浏览 0提问于2017-02-09得票数 1

1回答

如何用空列表值替换Pandas列NaN值？

、、

给定一个json记录字符串，其中每个记录的“模式”不一致(例如，每个记录都没有完整的“列”集)： s = """[{"a": 3, "b":[]}, {"a": 4, "b": [4]}, {"a": 5}]""" 一只熊猫DataFrame可以用这个字符串构建： import pandas as pd import json json_df = pd.DataFrame.from_records(json.loads(s)) 这会导致 a b 0 3

浏览 3提问于2020-03-31得票数 1

回答已采纳

2回答

如何强制pdfplumber根据上面行的列数提取表格？

、

我正在尝试用python包pdfplumber从PDF文档中提取一个表。该表有四列和多行。第一行是标题，第二行只有一个合并的单元格，然后值被正常保存(例如) pdfplumber能够检索表格，但如果有四列，它会生成6列，并根据列保存值。 Table as shown in PDF document ? 我尝试使用不同的表格设置，包括“垂直策略”：“线”，但这产生了相同的结果。 # Python 2.7.16 import pandas as pd import pdfplumber path = 'file_path' pdf = pdfplumber.open(

浏览 47提问于2019-10-09得票数 0

2回答

(Python)转换数据

、

我的目标是转换数据格式。源和目标表单是这样的。而taget的日期列是索引。如何将源表转换为目标窗体？(我尝试了pd.DataFrame([sum(list(df.values())，[])，但它不起作用) #Source form #date is 2021-11-24 import pandas as pd df = pd.DataFrame({'A': [10, 20, 30],'B': [100, 200, 300]}) A B 10 100 20 200 30 300 #Target form (date is inde

浏览 12提问于2022-02-04得票数 -1

回答已采纳

1回答

如何在Scala/Spark中使用字符串作为表达式/参数？

、、、、

我正在尝试使用dataframe中的现有列向dataframe中添加更多的列。然而，Scala是不可变的，因此很难进行迭代。因此，我想出了一个for循环来输出字符串(参见下面的示例代码，它存储了我可以使用的整个语句)。 val train_df = sqlContext.sql("select * from someTable") /*for loop output is similar to the Str variable as below*/ var Str = ".withColumn(\"newCol1\",$\"col1\"

浏览 0提问于2018-08-15得票数 0

回答已采纳

2回答

Scala中的foldLeft是如何在DataFrame上工作的？

我需要在Hive中摄取一个关系数据库管理系统表，在使用regex_replace模式将其插入一个Hive表之前，我必须清理它的字符串列中的数据。在无法理解如何在我的dataFrame上应用它之后，我终于在Scala中遇到了一个方法，它是foldLeft，它有助于满足需求。我理解foldLeft如何在集合上工作，例如： List(1,3,9).foldLeft(100)((x,y) => x+y) foldLeft接受参数: initialValue和一个函数。它将函数的结果添加到累加器中。在上述情况下，结果是: 113。但是当涉及到dataframe时，我无法理解它是如何工作的。 v

浏览 1提问于2018-08-26得票数 15

回答已采纳

5回答

从列表中更改Pandas Dataframe中的列名

、

是否可以使用列表中的数据更改列名？ df = pd.DataFrame([[1, 1.0, 2.3,0.2,0.53], [2, 3.35, 2.0,0.2,0.65], [2,3.4, 2.0,0.25,0.55], [3,3.4,2.0,0.25,0.55], [1,3.4,2.0,0.25,0.55], [3,3.4,2.0,0.25,0.55]], columns=["ID", "A", "B","C","D"])\ .set_index(

浏览 16提问于2017-08-02得票数 9

回答已采纳

3回答

用空值替换dataframe的值，用1和0替换是和否

、、

我有一只熊猫DataFrame，它看起来像这样： molecule species 0 a dog 1 b horse 2 c [] 3 d pig 4 e [] 我希望使用python将[]值替换为NaN。我怎样才能做到这一点？用于测试： df = pd.DataFrame({ 'molecule': ['a','b'

浏览 11提问于2022-11-08得票数 0

1回答

在创建dataframe时指定列名将导致NaN值

、、

我有一个正在转换为数据帧的字典列表。当我尝试传递column参数时，输出值都是nan。 # This code does not result in desired output l = [{'a': 1, 'b': 2}, {'a': 3, 'b': 4}] pd.DataFrame(l, columns=['c', 'd']) c d 0 NaN NaN 1 NaN NaN # This code does result in desired output l = [{

浏览 47提问于2020-05-12得票数 6

回答已采纳

1回答

python:在FOR循环中获取的多列pandas数据文件

、

我正在编写一个Python脚本，它循环遍历N个.SDF填充，使用glob创建它们的列表，为每个文件执行一些计算，然后以pandas数据文件格式存储这些信息。假设我计算每个文件的4个不同属性，对于1000个填充，预期输出应该以5列1000行的数据文件格式汇总。以下是代码的示例： # make a list of all .sdf filles present in data folder: dirlist = [os.path.basename(p) for p in glob.glob('data' + '/*.sdf')] # create empty

浏览 43提问于2020-12-01得票数 0

回答已采纳

2回答

如何使用search(Ctrl + Shift + F)按钮替换vs代码中的双引号？

、

我有一个Nodejs项目，它使用单引号和双引号，但现在我想遵循相同的标准(在整个项目中使用双引号)。那么，如何将所有单引号替换为双引号呢？我像这样搜索'(.+?)'，但是如何替换它们呢？

浏览 4提问于2021-06-13得票数 0

回答已采纳

1回答

sql-魔术查询在专用单元格中执行时工作，但在内联执行时不起作用。

、、

我有一个类似这样的查询： SELECT * FROM my_table WHERE columns_name = 'example text 9999-' -- note the double spaces before the number and dash at the end... don't know if it's actually important, but is the only outlier in format compared to other queries that work 在jupyter中，查询是从熊猫数据中动态

浏览 4提问于2022-06-23得票数 0

回答已采纳

1回答

具有一行数据的Pandas read_csv()返回空数据帧

、、

我有一个csv文件，其中只有一行数据没有标题。下面是我将数据导入到dataframe中的代码： df2 = pd.read_csv(path2, header=0) 当我执行read_csv时，它返回以下内容： Empty DataFrame Columns: [0.940456, 0.077893, 0.840178, 0.668612, 0.923643, 0.641833, 0.845249, 0.361605, 0.453943, 0.695509, 0.825763, 0.503687, 0.617303, 0.276637, 0.636244, 0.075744] Index:

浏览 12提问于2019-02-06得票数 4

回答已采纳

1回答

如何将另一个dataframe列的值显示为轴标签？

、

数据： d = { 'name': ['Lynda', 'Sharon', 'Claudia', 'Jennifer', 'Lucy'], 'rank': [1, 2, 3, 4, 5], 'hours_studied': [40, 60, 80, 20, 50] } df = pd.DataFrame(data=d) 图表： bars = alt.Chart(df).encode( x='hours_studied:Q

浏览 2提问于2020-03-20得票数 1

回答已采纳

1回答

在python中使用.apply应用映射程序

、

这应该很简单，但我想不出来。我有一个“映射器”DataFrame，它看起来像这样： mapper={'old_values':[105,312,269],'new_values':[849,383,628]} df=pd.DataFrame(mapper) 然后，我有另一个包含旧值的列的dataframe。我只是想把它们全部转换成新的价值观(例如，所有105个应该变成849个)。我想我需要使用df.apply，但是我找不到如何做到这一点的例子。提前谢谢。

浏览 4提问于2017-01-12得票数 1

回答已采纳

1回答

在Python Pandas中删除数据框行名称

、、

我在Pandas中有一个这样的数据帧： # https://www.datasciencemadesimple.com/reshape-long-wide-pandas-python-pivot-function/ import pandas as pd import numpy as np from platform import python_version print(python_version()) #3.7.7 #Create a DataFrame d = {'countries':['A','B','C'

浏览 75提问于2020-10-18得票数 0

1回答

Pandas Keyerror

、

我有一个非常简单的代码： stats2 = {'a':[1,2,3,4,5,6], 'b':[43,34,65,56,29,76], 'c':[65,67,78,65,45,52], 'cac':['mns','ab','cd','cd','ab','k']} f2 = pd.DataFrame(stats2) f2.set_index(['cac'], inplac

浏览 2提问于2016-05-12得票数 2

回答已采纳