如何使用.startswith在数据帧中创建新变量？

在云计算领域，了解和掌握云原生、网络通信、网络安全等知识是非常重要的。同时，熟悉前端开发、后端开发、数据库、服务器运维等技术也是必不可少的。此外，精通音视频、多媒体处理、人工智能、物联网、移动开发、存储、区块链、元宇宙等专业知识也会为你在云计算领域的专家角色增添更多的优势。

你提到了一个具体的问题：如何使用.startswith在数据帧中创建新变量？

.startswith是字符串的方法，用于判断字符串是否以指定的前缀开始。然而，在数据帧（DataFrame）中创建新变量并不直接使用.startswith方法，而是使用一些其他方法来实现类似的功能。

在数据帧中创建新变量，可以使用 pandas 库来操作。以下是一个示例代码，展示如何在数据帧中使用.startswith创建新变量：

import pandas as pd

# 创建一个示例数据帧
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Age': [25, 30, 35, 40, 45],
        'City': ['London', 'New York', 'Paris', 'Tokyo', 'Berlin']}
df = pd.DataFrame(data)

# 使用.startswith方法创建新变量
df['StartsWithA'] = df['Name'].apply(lambda x: x.startswith('A'))

# 输出结果
print(df)

上述代码中，首先创建了一个示例数据帧df，包含了Name、Age和City三列。然后，使用df['Name'].apply(lambda x: x.startswith('A'))对Name列中的每个字符串使用.startswith方法来判断是否以'A'开头，将返回的布尔值赋给新的列StartsWithA。最后，通过print(df)输出数据帧的内容。

这样，就可以在数据帧中根据字符串的前缀创建一个新的布尔型变量。你可以根据实际情况修改.startswith方法中的前缀字符。

在腾讯云相关产品中，可以使用腾讯云的云服务器、云数据库等产品来进行数据处理和存储。具体的产品介绍和链接地址可以根据实际需求进行选择和查阅。

如何使用.startswith在数据帧中创建新变量？

、、、

我在python中有一个这样的数据帧： data = [['a_subj.163', 1], ['b_subj.164', 2], ['c_subj.165', 3]] df = pd.DataFrame(data, columns = ['subj', 'mean']) subj mean 0 a_subj.163 1 1 b_subj.164 2 2 c_subj.165 3 我需要取subj以'a.subj‘开头的平均值，并将其添加到一个名为mean_a的新变量

浏览 7提问于2021-11-01得票数 0

回答已采纳

2回答

PySpark数据帧的最佳实践-删除多个列？

、、、

假设有人想要从数据帧中删除一列。可以在不创建新数据帧的情况下做到这一点吗？ df = df.drop("tags_s") 看起来创建一个新的数据帧更安全，更正确，对吗？通过重用如上所述的数据帧可能会遇到什么问题？如果重用数据帧是一种糟糕的做法，假设有人想要删除几个与模式匹配的列： for col in df.columns: if col.startswith("aux_"): df = df.drop(col) 在这种情况下，每次创建一个新的数据帧似乎不切实际。最佳实践是什么？

浏览 21提问于2019-11-22得票数 0

2回答

Pandas提取行以分离数据帧

、、

给定此示例数据帧，我尝试将Code列中的值以'HCC‘开头的所有行以及下一个'HCC’之前的所有行提取到单独的数据帧中： Code Description HCC001 <empty string> A1 Description of A1 B1 Description of B1 HCC002 <empty string> A2 Description of A2 B2 Description of B2 C2 Descript

浏览 24提问于2021-10-05得票数 0

回答已采纳

2回答

Python动态数据帧名称

、、、

我一直在尝试在Python中为dataframe使用动态名称。我的目标是读取如下文件夹中的csv文件列表： aaa.csv bbb.csv ccc.csv 例如： path = "../somepath/" files = [f for f in os.listdir(path)] 然后，对列表进行循环，并为每个步骤从csv文件创建一个数据帧，如下所示 df_aaa = pd.read_csv('/../csv/aaa.csv') 我正在尝试创建一个函数来读取文件夹中的文件并创建数据帧，以供其他python脚本调用和重用，而不是在每个脚本中手动创建数据帧。

浏览 17提问于2021-04-19得票数 0

1回答

如何在给定部分名称的情况下提取列

、

给定一个带有列名的数据帧： "openPrice1", "closePrice1", "openPrice2", "closePrice2", "openPrice3", "closePrice3"... 如何提取包含"open"的所有列例如，我想要一个新的数据帧： "openPrice1", "openPrice2", "openPrice3" ...

浏览 0提问于2020-03-22得票数 1

1回答

巨蟒乌鸦。发送部分帧

、、、

在我们的项目中，乌鸦花费了很多时间来创建和发送消息到哨兵。我们检查了创建有关帧的数据的许多时间成本，但我们并不经常需要所有帧的数据。有没有可能以及如何创建关于不是所有帧的数据，只是在有异常或错误的帧之前的最后2-3帧，并通过raven将其发送到哨兵。或者是否有可能在消息级别创建依赖全栈/部分栈？即在关键或异常或错误级别发送整个堆栈，而在调试或警告级别仅发送帧的一部分。

浏览 5提问于2014-03-19得票数 0

3回答

创建统计pandas实例中pos数量的函数

、

我使用NLTK在一个古老的Yelp竞赛中的熊猫数据帧中pos_tag语句。这将返回一个元组列表(word、POS)。我想计算一下每个实例的词性数量。比方说，我该如何创建一个函数来计算每次复习中存在的动词数量？我知道如何将函数应用于特性--这没问题。我就是想不通如何计算pd特性中列表的元组中的东西。 The head is here, as a tsv: https://pastebin.com/FnnBq9rf

浏览 3提问于2018-02-22得票数 1

3回答

使用正则表达式从pandas数据帧中删除行

、、

假设我有一个像这样的熊猫数据帧： Word Rating 0 Bear 1 1 Yuck 2 2 Girl 3 3 Yellow 4 如何在pandas中使用正则表达式来过滤掉包含以字母"y“开头的单词，但保留数据帧格式的行？我知道正则表达式模式应该是r"\b^y\w+\b“。预期输出： Word Rating 0 Bear 1 2 Girl 3

浏览 6提问于2017-08-04得票数 2

3回答

如何在python pandas数据帧中应用通配符？

、、

我有一个数据帧： Car Color BMW WHITE BMPrO Black Toyota Green Honda Black 我希望创建一个基于Car列的列，如果Car列以BM*开头，则ID列将是A如果Car列以T开头，则ID列将是B否则C 预期的数据帧 Car Color ID BMW WHITE A BMPrO Black A Toyota Green B Honda Black C 有谁有主意吗？我已经尝试过这段代码，但在这种情况下不起作用： def f(row):

浏览 1提问于2019-05-03得票数 2

3回答

在panda数据帧上应用IF条件

、

我有一个包含三列的数据帧：Subchannel、Campaign和ID Subchannel Campaign ID PROMO FLASHSALES X123 PROMO PERCENTOFF Y123 我想写一段python代码，如果子通道以"PRO"开头，那么应该在dataframe EML_LOOKUP中创建一个新列，其值与列ID相同。下面是我正在尝试的代码，但它不起作用。请帮帮忙。 if EML_LOOKUP['Subchannel'].str.startswith("

浏览 26提问于2020-07-11得票数 1

回答已采纳

1回答

基于从特定字符或字符串开始的因素级别的子集数据帧

、、、

我正在尝试根据一个因子(这里是ID)对数据帧进行子集。我想要的是基于因子级别的子集，从一个特定的字符开始。下面是一个数据帧示例： ID = c("100", "100a", "101", "103", "204", "206", "207", "207a", "207b") # ID is a factor Value = rnorm(9) df = data.frame(ID, Value) 我希望得到两个独立的数据帧，一个ID以"1“开头

浏览 1提问于2017-08-02得票数 3

2回答

如何从以2K开头的pyspark数据帧中删除记录

、、

我使用的是pyspark 3.0.1。我想从我的pyspark数据帧df的列group中删除记录以2K开头的行。我的样本数据如下所示 Name Age Group John 23 1L12 Rami 32 2K18 Pat 35 1P28 删除后，我的最终数据帧应该如下所示 Name Age Group John 23 1L12 Pat 35 1P28

浏览 1提问于2021-03-04得票数 0

1回答

创建拼写相似的pandas数据框变量名称列表

、、、

在我的环境中，我有一个由几个pandas数据帧组成的列表，它们的名称类似。例如： import pandas as pd import numpy as np df_abc = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_xyz = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD') df_2017 = pd.DataFrame(np.random.randn(

浏览 0提问于2017-06-19得票数 1

1回答

我需要根据一定的标准在熊猫列上应用多重方程。

、、

我有一个数据，它需要基于某些标准的多个方程。我需要获取标识符的前3个字母，如果是True，则需要将与该行相关的值除以一定的值。数据格式如下： ID Value US123 10000 US121 10000 MX122 10000 MX125 10000 BR123 10000 BR127 10000 如果ID以'MX‘开头，则需要将值除以100，如果ID以'BR’开头，则将值除以1000。所有其他价值都需要保持不变。我也不想创建一个新的过滤数据。我已经通过ID进行了成功的过滤，然后执行逻辑检查，但是我需要在更大的框架上应用它。这是我用于过滤帧的代码。

浏览 3提问于2016-11-08得票数 0

回答已采纳

2回答

如何根据关键字将列表拆分为较小的列表？(C# XNA)

、、、

嗨，我目前正在为一个C# / XNA应用程序开发一个导入程序，我需要一些帮助将输入(每一行都是一个“新”字符串)过滤出较小的块(较小的字符串列表)。这是一个示例，说明如何将输入划分为“帧”，并提供创建“关键帧”所需的网格和摄像机数据。 num_frames 4 start 1 end 24 frame_rate 24 frame 1 meshes 2 name pCube1 color F:/MayaImporterExporter/ImporterExporter/Bin/Textures/image2.gif bump F:/MayaImport

浏览 5提问于2013-08-05得票数 0

4回答

如何在np.where()中将list的元素作为条件？

、、、、

我想要基于另一列的值创建一个新列，在该列中为新列中分配的值计算某些条件。我读了一些关于np.where()的问答(Numpy np.where multiple condition)，但无法推断出最好的(有效) Pythonic方式。示例数据帧为： period 0 JAN16 1 YTD JAN16 我希望在以下条件下为列period_type赋值:如果period以x开始(其中x是列表-> 'JAN'，'FEB'，'MAR'，'APR'，'MAY'，'JUN'

浏览 60提问于2019-05-02得票数 0

回答已采纳

1回答

使用相关矩阵中的目标变量列填充Python Pandas Dataframe

、、、、

我有一个由不同数据类型的45个变量组成的pandas数据框架，我正在使用'dython.nominal‘包来创建每个变量之间的关联矩阵。然后我想：答:子集我的数据帧(按地理位置过滤)，并在该子集上计算关联矩阵，然后 B:使用在步骤A中创建的数据帧中的目标变量的列，创建第二个pandas数据帧并添加到第二个pandas数据帧中。然后，得到的数据帧将是一个相关性矩阵，其中列索引是地理位置，行索引是其他44个变量。到目前为止，我拥有的代码是： import pandas as pd from dython.nominal import compute_associations t

浏览 0提问于2020-10-26得票数 2

1回答

在dataframe列中查找以string开头的所有元素

、

我目前正在用下面的代码汇总数字。对于dataframe中的每个元素，我设置了几个求和条件，但它是已创建的报告中最慢的部分。有没有一种更快的方法来识别数据帧中以某个字符串开头的所有元素？ for idx, eachRecord in attributionCalcDF.T.iteritems(): if (attributionCalcDF['SEC_ID'].ix[idx] == 0): currentGroup = lambda x: str(x).startswith(attributionCalcDF['GROUP_LIST

浏览 2提问于2012-06-29得票数 1

4回答

获取'.rda‘文件中数据集的名称

假设我有一个使用save()创建的.rda文件。示例： save(mydata1, file = "anrdatafile.rda") 其中，mydata1是一个数据帧。我想用R编写代码：(1)加载'anrdatafile.rda‘文件；(2)在该文件中查找数据帧的名称(3)将找到的数据帧与另一个数据帧(如mydata2 )组合。如何实现步骤2？在获得步骤2中的数据框的名称后，我可以执行以下操作 combineddata = rbind(mydata1, mydata2) 但是我不知道如何将.rda文件中数据帧的名称mydata1作为代码的一部分。我试过了 nam

浏览 0提问于2011-06-11得票数 3

回答已采纳

1回答

对数据列表进行排序

、、

我有一个巨大的数据帧列表，我想按名称进行排序。示例 Data_frames_list = [sensor 1 (South), sensor 6 (North), sensor 3 (South), sensor 1 (North), ...] 我想按传感器编号对其进行排序(这些是包含大量行的数据帧名称)。最终结果示例 Data_frames_list = [sensor 1 (South), sensor 1 (North), sensor 2 (South), sensor 2 (North), sensor 3 (South), ...] 有人知道我该怎么做吗？

浏览 4提问于2022-01-18得票数 0

回答已采纳

2回答

R基于应用于列名的正则表达式从数据帧中提取子集

、、

我有一个R数据帧，我想根据列名过滤(创建一个子集) 数据帧： df<-data.frame( x = c(1:4), "A-1" = c(rnorm(4,11,4.4)), "A-2" = c(rnorm(4,11,4.4)), "B-2" = c(rnorm(4,11,4.4))) x A.1 A.2 B.2 1 8.704004 17.505799 12.025182 2 12.293454 9.452140 10.628045 3 12.100977 3.6140

浏览 15提问于2020-02-27得票数 1

1回答

以迭代方式向具有唯一列名的dataframe添加新列

、、

我有一个数据帧进入for循环。在每个循环中，都会向数据帧中添加一个新列。列数未知。如何在这种情况下自动命名列，以便程序每次添加新列时，该列都会获得唯一的名称，如下所示： x xx xxx xxxx xxxxx 1 12 14 2 24 26 3 64 66 我在add_prefix()中尝试了cumcount()，但它不起作用。有什么建议吗？

浏览 17提问于2019-10-16得票数 1

回答已采纳

3回答

根据列名列表过滤Pandas Dataframe

、、

我有一个可能有1000列的pandas数据框架。但是，我不需要太多的columns>，只有当它们匹配/开始/包含特定字符串时才需要这些列。假设我有一个数据框列，比如df.columns = HYTY, ABNH, CDKL, GHY@UIKI, BYUJI@#hy BYUJI@tt BBNNII#5 FGATAY@J .... 我要选择名称仅为HYTY、CDKL、BYUJI*和BBNNI*的列所以我要做的是创建一个正则表达式列表，如下所示： import re relst = ['HYTY', 'CDKL*', 'BY

浏览 40提问于2020-08-12得票数 0

回答已采纳

1回答

根据熊猫Python中另一个数据的条件从一个数据中删除行

、、、、

我有两个熊猫数据框架，包含数百万行的巨蟒。我希望根据以下三个条件从第一个数据帧中删除行，该数据帧包含单词(以秒为单位)：如果单词出现在句子开头的一行如果单词出现在句子末尾的一行如果单词出现在句子的中间一行(确切的单词，而不是子集) 示例：第一个Dataframe： This is the first sentence Second this is another sentence This is the third sentence forth This is fifth sentence This is fifth_sentence 第二个Dataframe： Second forth

浏览 1提问于2021-06-11得票数 1

回答已采纳

1回答

Pandas数据框列选择

、

我使用Pandas从数据帧olddf中选择列。假设变量名是'a'，'b'，'c'，‘starswith1 1’，‘startswith3 2’，‘startswith3 3’，...，‘startswith3 10’。我的方法是创建一个具有公共起始值的所有变量的列表。 filter_col = [col for col in list(health) if col.startswith('startswith')] 然后，我想按名称选择该列表中的列以及其他列，这样我就不必全部键入它们。然而，这不起作用： newdf =

浏览 0提问于2016-04-08得票数 0

3回答

Python:搜索csv文件以查找特定的字符串和存储行号，供以后使用

、

我有一个csv文件，这是一个通风气体分析程序的输出，我试图(最终)进入pd数据帧。问题是，在获取原始数据之前，文件的顶部有一堆“摘要数据”。我不能在特定的行中编程，因为用于摘要数据的行数可能因文件而异。在原始数据的顶部有一个常量，可以搜索，如果我能够识别可用于提取的行。下面的屏幕截图显示了excel中打开的文件--我想要搜索的部分是A27中的时间。当前的代码，我一直在混乱，试图找到行并打印它： import csv with open('parvo_sb.csv', 'rU') as csvfile: datareader = csv.r

浏览 7提问于2017-09-19得票数 0

回答已采纳

1回答

Python:将df中的行数添加到另一个df中作为新列

、、、、

假设我计算了熊猫数据帧中的行数。我使用以下代码来完成此操作： df.shape 它给出了以下结果：(1700，12) 如何将1700值添加到现有的pandas数据帧中？我们将把与该值相关联的列称为D。当前数据帧： A B C 30 40 text 所需数据帧： A B C D 30 40 text 1700

浏览 2提问于2018-04-18得票数 0

1回答

Pandas根据其他行中的字符串保留某些行

、

我有以下数据帧 +-------+------------+--+ | index | keep | | +-------+------------+--+ | 0 | not useful | | | 1 | start_1 | | | 2 | useful | | | 3 | end_1 | | | 4 | not useful | | | 5 | start_2 | | | 6 | useful | | | 7 | useful | | |

浏览 31提问于2020-07-22得票数 0

回答已采纳

1回答

根据数据帧的字母数字名称循环数据帧，并在每个数据帧中创建一列

、、

我有多个名为df1,df2...df100的数据帧。我想创建一个名为file的新列，并在每个文件中用它们的文件名填充值。例如：df1['file'] = 'df1'为所有数据帧循环它。

浏览 0提问于2018-05-30得票数 0

1回答

将1列中的空值替换为另一列中的数据

、

我正在尝试用可能在count_2列中的数据替换count_1列中的所有空数据。下面是给定输入的预期输出。我如何在Spark Scala中做到这一点？输入数据帧 name count_1 count_2 Java 10000 null Python null 20000 Scala 30000 null R null null Swift 50000 65000 输出数据帧 name merged Java 10000 Python 20000 Scala 30000 R null Swift 50000

浏览 23提问于2021-09-05得票数 1

回答已采纳

2回答

如何避免多帧？

、、、

我正在创建一个Java桌面应用程序。在这个应用程序中，我有一个表。如果用户双击表格的行，则相应的数据将在另一个窗口框架->视图框架中查看。用户最小化图幅并选择表中的另一行。它再次在新的窗框中打开。如何避免多帧？我一次只想要一个视图帧。假设用户想要查看新数据，那么旧的图框将退出，而新的图框将打开。

浏览 0提问于2012-08-18得票数 2

回答已采纳

1回答

如何获取条件，将其应用于列，并获取条件为真的位置之间的值，并基于这些值创建另一列？

、

我有一个数据帧，看起来像这样： Name V S_1 NaN 01 p 02 p S_2 NaN 03 p S_3 NaN 04 p 我想让"Name“列中包含"S_”的值在它自己的列中，"S_“值在它自己的列中(与"S_”值对齐)，"V“列中的值与"Name”列对齐。因此，最终的数据帧将如下所示： Name Name2 V S_1 01 p S_1 02 p S_2 03 p S_3 0

浏览 14提问于2020-10-01得票数 0

回答已采纳

2回答

根据条件火花选择列

我的dataframe df1中有这样的列，其中以20开头的列是动态生成的。我可以使用以下方法将以20开头的列重命名为2019_p、2020_p、2021_p df.select(*[col(c).alias(f"${c}_p") if c.startswith("20") else col(c) for c in df.columns]) 现在我有了两个数据帧，一个原始数据帧和另一个数据帧，列以20开头，以_p结尾。我希望根据不带_p或with_p的非空列来最终选择列。如何实现这一点？

浏览 7提问于2022-10-31得票数 0

回答已采纳

1回答

星星之火SQL只有DataFrame的一列

、、、

浏览 0提问于2018-05-08得票数 4

回答已采纳

2回答

R:标识dataframe中的列名是否包含字符串

、、

假设我有两个数据帧： df1： Name Data123 Data321 Age A 123 321 20 df2： Name Age B 20 我希望检查哪个dataframe的列名包含字符串"Data“。如果是，数据帧将作为一个整体传递到自定义函数中。因此，在本例中，我只希望将df1传递给上述函数。请指教

浏览 45提问于2020-04-02得票数 1

回答已采纳

2回答

这种对javascript闭包的解释正确吗？

、

对于tl;dr，在为表中的行创建单击处理程序时，使用闭包使函数指向内存中的相同位置，而不是像下面的代码那样每次都指向不同的位置。否则：我正在学习javascript，我想我明白了闭包是什么以及它为什么有用。这是我的推理；它是正确的吗？对于HTML表，下面的代码总是显示被单击的最后一行，即使我单击了第一行或第二行。我的推理是代码创建了3个不同的堆栈帧，每个堆栈帧的i分别等于0、1和2。因为2是最新的堆栈帧，所以fnPtr的返回值指向2。 var table = document.getElementById("tableid3"); var rows = table.get

浏览 0提问于2012-12-26得票数 1

回答已采纳

1回答

Python/Pandas dataframe -返回列名

、、

有没有办法将列的名称/标题返回到pandas数据帧中的字符串中？我想处理具有相同前缀的一行数据。数据帧头如下所示： col_00 | col_01 | ... | col_51 | bc_00 | cd_00 | cd_01 | ... | cd_90 我想对每一行应用一个函数，但只能分别从col_00到col_51，从cd_00到cd_90。为此，我想我应该将列名收集到一个列表fe中。to_work_with将是以‘to_work_with’前缀开头的列的列表，请将函数应用于df[to_work_with]。然后我更改to_work_with，它将包含以'cd‘前缀等开头的列的列表。

浏览 0提问于2016-07-03得票数 1

回答已采纳

5回答

如何使用正则表达式从dataframe中选择列

、、

我在python pandas中有一个数据帧。数据帧的结构如下： a b c d1 d2 d3 10 14 12 44 45 78 我想选择以d开头的列。在python中有没有简单的方法来实现这一点。

浏览 136提问于2015-06-13得票数 91

回答已采纳

1回答

自动创建Pandas中的子数据(有类吗？)

、、

我有一个数据框架，我想要创建一些子数据格式。现在我“手工”创建了3个子数据集，但是我想要自动化这个过程，因为我需要重用代码，而且将来子数据集可能超过3个。假设这是我的数据集： import pandas as pd data = {'line':['a', 'b', 'c', 'a', 'a', 'b', 'b', 'b', 'c', 'r', 'j', 'j', 'r&#

浏览 1提问于2022-01-21得票数 0

2回答

如何通过布尔值进行过滤？

、、

我提取了一系列的布尔值，我想在Pandas中从其中过滤一个数据帧，但它没有返回任何结果。数据帧 Account mphone rphone BPHONE 0 14999201 3931812 8014059 9992222 1 12980801 4444444 3932929 4279999 2 9999999 3279999 4419999 3938888 以下是系列： df['BPHONE'].str.startswith(tuple(combined_list)) 0 False 1 True 2 False Name: BP

浏览 42提问于2020-01-30得票数 0

回答已采纳

1回答

将字符串传递给Python函数，并将该字符串用作dataframe中的列名

、、、、

我正在尝试使用作为python函数属性传递的字符串来创建数据帧。该字符串用于提供参数，以便将某些数据收集到数据帧中。我想使用字符串重命名数据帧，并使用字符串重命名其中一个列名。我附上了下面的代码，以防它不清楚我想要什么。 def stock(tick): tick=tick.upper() tick, metadata=ts.get_daily(symbol=tick, outputsize='full') tick['date']=tick.index tick.index.name='index' t

浏览 11提问于2020-01-27得票数 0

1回答

R编辑父环境中定义的全局对象

我想要编辑父函数中定义的数据帧dat，就像在示例中一样，但输出(从main返回)给出了一个未进行编辑的数据帧。这显然是因为在R中滥用了全局变量，但有人能解释一下为什么会这样吗?我如何才能让它发生？ indat <- data.frame(a = '0', b = '0') main <-function(data){ assign("dat", data, envir = .GlobalEnv) inner1() inner2() return(dat) } inner1<-

浏览 0提问于2015-04-15得票数 0

2回答

从大熊猫中提取排

、、

我有一个数据帧作为下面的图像。我想提取数据帧的行，这些数据帧的年份和月份为'1395/01‘。我使用了下面的代码，但我知道这是不正确的，因为我们可以在一系列字符串上使用字符串切片。有人能告诉我一种不用嵌套for循环的方法吗？ df[df['Date'][:7] == '1395/01']

浏览 0提问于2021-04-02得票数 0

回答已采纳

2回答

如何将数据帧中的特定列与同一数据帧中的特定列相乘？

、、、

我有一个数据帧，我需要基于其他列与特定列的乘积来创建新列这是我的数据框的样子。 df： Brand Price S_Value S_Factor A 10 2 2 B 20 4 1 C 30 2 1 D 40 1 2 E 50 1 1 F 10

浏览 18提问于2021-02-02得票数 0

回答已采纳

2回答

以字符串开头的星火数据帧搜索列

、

我需要根据列值应该以预定义字符串开头的条件来筛选数据帧。我正在尝试以下几点： val domainConfigJSON = sqlContext.read .jdbc(url, "CONFIG", prop) .select("DID", "CONF", "KEY").filter("key like 'config.*'") 并得到例外：由: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException:引起，您的SQL

浏览 4提问于2017-08-07得票数 15

回答已采纳

1回答

Tensorflow:在具有不同类别数量的新数据集上优化预训练模型

如何在新数据集上微调tensorflow中的预训练模型？在Caffe中，我可以简单地重命名最后一层，并设置一些随机初始化的参数。类似的事情在tensorflow中也是可能的吗？假设我有一个检查点文件(deeplab_resnet.ckpt)和一些设置计算图的代码，我可以在其中修改最后一层，使其具有与新数据集具有的类相同的输出数量。然后，我尝试像这样启动会话： sess = tf.Session(config=config) init = tf.initialize_all_variables() sess.run(init) trainable = tf.trainable_varia

浏览 6提问于2017-01-20得票数 10

回答已采纳

1回答

按五分位数选择和排序复杂数据帧

、、

我有一个复杂的数据帧(orig_df)。在这25列中，有5列是我希望用作分组标准的描述和特征。其余的是时间序列。有成千上万的行。我在初步分析和数字总结中注意到，在一些特定的分组标准中，异常观察存在重大问题。我使用了"group by“，并查看了这些组中的五分位数结果。我想要消除相对于(基于分组的五分位数)的低和高(单个观察)异常值，以改进决策树和聚类分析。我还希望保留离群值，以便单独分析根本原因。我如何操作数据帧，以便将单个观察值与基于组的五分之一结果进行比较，并保存解析(orig_df变为ideal_df和outlier_df)？

浏览 12提问于2018-01-07得票数 0

2回答

在python中，如何使用for循环覆盖列表中的dataframe？

、、

你好，我想用for循环修改列表中的数据帧。我的函数运行良好，并且我的数据帧在函数中被修改，但是一旦我想拥有这些新的数据帧(与旧的数据帧具有相同的名称)，显示的不是数据帧，而是旧的数据帧。我得出结论，我不能覆盖我的旧数据帧。我在列表中的所有数据帧都是这样的： index customer_region number_order distance_between_seller_customer date_last_order mean_days_between_orders mean_item_per_order mean_volume_item_ordered 6

浏览 0提问于2021-04-20得票数 0

1回答

Pandas如何复制和添加基于两列的值的新列

、、、

我有一个名为contest的数据帧这里有两个我感兴趣的专栏 TST =拍摄总数SM =拍摄次数我想复制这个名为contest的数据框，并创建一个划分SM/TST的新列我用的是pandas和numpy。制作数据帧的新副本的步骤。将新列添加到复制的数据帧中，并将该计算称为shotperc = shot百分比将非常有帮助。我这周才开始使用Jupyter笔记本。

浏览 0提问于2020-09-20得票数 0

2回答

如何创建具有从列表中提取的重复值基值的数据框架？

、、、

我有一个名单，名单X，有26个成员，比如说A.Z 如何创建一个有一个列的数据框架，使A比B来100次等等？然后，我将不得不将这个数据框架与另一个数据框架中的2600个值连接起来，该数据帧没有字母表引用，但我知道它们是有序的，每个字母表都有100个值。对于模拟，您可以创建2600个随机值的数据帧。这是一个很容易复制的例子。感谢你对R代码的帮助？或者可以通过一个数据帧有26个值，而另一个有2600个值，通过完全案例选项来完成吗？

浏览 4提问于2020-09-14得票数 0

回答已采纳