PANDAS :匹配两列并返回索引_两列匹配值，返回索引位置列表_Pandas -添加列，匹配索引 - 腾讯云开发者社区

python、pandas、chunking

我有一个大的固定宽度的文件被读成块10000行熊猫。除了从数据中删除重复项外，这对于所有东西都很有用，因为复制项显然可以在不同的块中。由于文件太大，无法全部装入内存，所以文件正在以块形式读取。我第一次尝试去复制文件的目的是只引入去重复文件所需的两列，并列出不读取的行列表。只阅读这两列(在大约500列中)很容易就可以在内存中使用，并且我能够使用id列查找重复项，并使用一个合格列来决定两个或三个具有相同id的列中的哪一个。然后，我使用read_fwf()命令的skiprows标志跳过了这些行。我遇到的问题是Pandas固定宽度的文件读取器不能同时使用skiprows = list和iterat

浏览 1提问于2015-06-04得票数 8

回答已采纳

1回答

熊猫数据的逐个元素划分与"/"？

python、pandas

如果能理解这是怎么回事就好了。也许Python/Pandas中有些东西我不太明白。我有一个数据(价格数据)，并希望计算的回报。行是股票，列是日期。为了简单起见，我用一些随机数建立了价格。 import pandas as pd import numpy as np df_price = pd.DataFrame(np.random.rand(10,10)) df_ret = df_price.iloc[:,1:]/df_price.iloc[:,:-1]-1 这里有两件事是很奇怪的：我的分子和分母都是10 x 9。为什么输出是10 x 10，第一列是nans。为什么结果都是0，除了第

浏览 2提问于2020-08-20得票数 0

回答已采纳

1回答

如何返回到多列和恢复行

python、pandas

在pandas中，我得到了一个函数，它接受一列的值，然后将结果返回给两列。现在，我还想限制使用/返回结果的行。我知道我可以返回多个专栏，如下所示： df = pd.DataFrame({'a':['foo bar', 'bar foo', 'foo foo', 'bar baz'], 'b': ['']*4, 'c': ['']*4}) def func(text): r

浏览 12提问于2021-05-25得票数 3

回答已采纳

1回答

如何使用正则表达式删除python pandas DataFrame中的行？

python、regex、pandas

我有一个模式： patternDel = "( \$(MoM|QoQ)\$)"; 我想删除pandas dataframe中列df['Event Name']与此模式匹配的所有行。哪种方法是最好的？数据帧中有超过100k行。

浏览 8提问于2016-10-10得票数 26

回答已采纳

2回答

Pandas中的意外NaN值

python、pandas

我有两个数据集。第一个名为'X‘，有8列，第二个名为'bayers_p’，有一个列。这两个集合的长度都为4152行，我想将列'bayers_p‘放入’X‘中，这对于menshion非常重要，该列'bayers_p’包含整数值0、1、2。为了做到这一点，我尝试使用以下代码行： type(X),type(bayers_p) (pandas.core.frame.DataFrame, pandas.core.frame.DataFrame) bayers_p['Column'].unique() array([2, 1, 0], dtype=in

浏览 2提问于2021-06-11得票数 1

回答已采纳

1回答

使用另一列中的值为列切片赋值不会引发形状不匹配错误

python、pandas

我有一个关于Pandas中形状广播是如何工作的问题。假设我有一个数据帧： df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [11, 22, 33, 44, 55]}) 我尝试将列'A‘的前两行替换为列'B’中的相应值。当我尝试将列B中的值显式指定为列表时： df.loc[[0,1], 'A'] = list(df['B']) 我得到了一个明显的形状广播错误： ValueError: shape mismatch: value array of shape (5,) c

浏览 11提问于2020-01-07得票数 3

回答已采纳

3回答

为什么groupby.apply返回重复级别

pandas

def afun(group): aa=len(group) group.sort_values(inplace=True) return pandas.DataFrame({'score':numpy.arange(aa),'price':group}) df = pandas.DataFrame({ 'stock':numpy.repeat( ['AAPL','GOOG','YHOO'], 3 ), 'date&

浏览 0提问于2016-08-15得票数 3

回答已采纳

1回答

向pandas DataFrame添加新列时的NaN值

python、pandas、dataframe、nan

我正在尝试在一个pandas DataFrame中生成一个新列，该列与另一个pandas DataFrame中的值相等。当我尝试创建新列时，我只得到新列值的NaNs。首先，我使用API调用来获取一些数据，'mydata‘DataFrame是按日期索引的一列数据。 mydata = Quandl.get(["YAHOO/INDEX_MXX.4"], trim_start="2001-04-01", trim_end="2014-03-31", collapse

浏览 1提问于2014-10-07得票数 26

回答已采纳

2回答

合并大熊猫的几个枢轴表

python、python-3.x、pandas

我怎么能合并两张熊猫枢轴表？当我尝试运行我的代码时，我有错误: keyerror data_pivot= pandas.DataFrame(data.pivot_table(值= 'NR_ACTIONS'，index="HOUR"，"OPID"，“名称”，列=‘CONTACTED_PERSON_NEW’，aggfunc=‘sum’) data_pivot.fillna(0，inplace=True) data2_pivot= pandas.DataFrame(data2.pivot_table(值=‘data.pivot_table_PA’，i

浏览 2提问于2015-08-19得票数 5

回答已采纳

2回答

仅将布尔掩码应用于数据框列的索引部分

python、pandas、indexing、mask

我有一个包含一些列的数据帧： >>> np.random.seed(0xFEE7) >>> df = pd.DataFrame({'A': np.random.randint(10, size=10), 'B': np.random.randint(10, size=10), 'C': np.random.choice(['A', 'B'], size=10)}) >>&g

浏览 4提问于2021-04-22得票数 3

回答已采纳

1回答

Pandas如何在不丢失列标题的情况下连接两个数据帧

python、pandas

我有以下玩具代码： import pandas as pd df = pd.DataFrame() df["foo"] = [1,2,3,4] df2 = pd.DataFrame() df2["bar"]=[4,5,6,7] df = pd.concat([df,df2], ignore_index=True,axis=1) print(list(df)) 输出：[0,1] 预期输出：[foo,bar] (顺序并不重要) 如果我能保证两个数据帧的标题是唯一的，有没有办法在不丢失原始列标题的情况下连接两个数据帧呢？我想到了遍历这些列，然后

浏览 1提问于2017-04-14得票数 16

回答已采纳

2回答

有错匹配行数的Python和NumPy.where行为

python、numpy、pandas、where

在下面的所有示例中，我都使用了Pandas0.8.1，但我可以确认，当我使用Pandas 0.11时，相同的示例对我来说是一样的。依赖于将Pandas版本更改为较新版本的解决方案不适用于我当前的问题(尽管请随意添加评论(而不是答案)来说明是否在新的Pandas版本中修复了这个问题)。我有一个Pandas DataFrame对象示例 In [20]: dfrm Out[20]: A B C D 0 1.202034 -0.285256 0.392160 0 1 1.799628 -0.169389 -0.305984

浏览 3提问于2013-08-28得票数 1

回答已采纳

1回答

pandas.Series.str.match与pandas.Series.str.contains的区别

pandas

pandas.Series.str.contains和pandas.Series.str.match有什么区别？为什么下面是这样的情况？ s1 = pd.Series(['house and parrot']) s1.str.contains(r"\bparrot\b", case=False) 我得到了True，但当我得到 s1.str.match(r"\bparrot\b", case=False) 我找到False了。为什么是这种情况？

浏览 0提问于2019-09-10得票数 7

回答已采纳

1回答

如何在Pandas dataframe中获得准确的行号和列号，即单元格地址

python、pandas

如何在Pandas dataframe中获得准确的行号和列号，即单元格地址？例如，我有以下数据帧： ClientID LastName 0 34 Johnson 1 67 Smith 2 53 Brows 怎样才能找到以‘’Smith‘为值的单元地址？返回1,1作为值的东西我知道可能会出现相反的情况，例如：df.get_value(1, 'LastName')，但请注意，在这里我也不知道列名。我只有密钥值，想要找到数据帧的确切单元地址。

浏览 50提问于2020-01-20得票数 1

回答已采纳

1回答

如何使用来自另一个dataframe的部分匹配筛选数据

python、csv、pandas、filtering、dataframe

我有两个dataframe，我想使用其中一个数据过滤另一个，并创建一个新的dataframe。这两个数据格式都有一个包含类似信息的列，但并不完全匹配。我一直在尝试使用str.contains，但到目前为止，我一直在尝试使用TypeError: 'Series' objects are mutable, thus they cannot be hashed。下面是我的数据文件和我尝试过的代码的示例。 promoter = pd.read_csv('promoter_coordinate.csv') print(promoter.head()) Associate

浏览 0提问于2015-07-29得票数 0

回答已采纳

1回答

使用excel用VLookup创建动态超链接

excel、hyperlink、spreadsheet、vlookup

我已经找到了解决这个问题的办法，但是我什么也找不到。假设我正在做两个工作表，A和B。工作表B有一个我称之为Price的单元格。价格取决于某个输入，输入来自工作表A中的AJ列。工作表A有一列(AJ)和一列(BW)。我的问题是这个。如何单击工作表B中的单元格(价格)并将其重定向或“超链接”到工作表A列BW中的适当单元格？

浏览 2提问于2017-09-27得票数 0

回答已采纳

1回答

将列的向量化分配给列的子集

python、pandas

我有一个Pandas DataFrame，包含i、行和j列。我希望将这个DataFrame中的值替换为第二个DataFrame中的所有值，后者具有相同的i行，但有k列，其中k是j的子集。有效的办法是： for col in df2.columns: df1[col] = df2[col] 有没有一种更快、更无头绪的方法？

浏览 2提问于2019-01-24得票数 1

回答已采纳

3回答

两种Pandas Dataframes的元素比较

python、python-3.x、pandas、dataframe

我正试着比较熊猫的两栏。我知道我能做到： # either using Pandas' equals() df1[col].equals(df2[col]) # or this df1[col] == df2[col] 但是，我要寻找的是比较这些列的大小，当它们不匹配时，打印出这两个值。我试过： if df1[col] != df2[col]: print(df1[col]) print(df2[col]) 当我得到“序列的真值是模棱两可”的错误时，我相信这是因为列被当作一系列布尔值来进行比较，这就导致了歧义。我还尝试了各种形式的for循环，但没有解决这个问题。有人能指

浏览 3提问于2020-05-09得票数 1

回答已采纳

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

python-3.x、pandas、concat、cbind

假设我有两个数据帧： import pandas .... .... test1 = pandas.DataFrame([1,2,3,4,5]) .... .... test2 = pandas.DataFrame([4,2,1,3,7]) .... 我尝试过test1.append(test2)，但它相当于R的rbind。如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

2回答

谁能帮我理解一下.index在这段代码中做了什么？

python、pandas、indexing

我有以下代码： print(df.drop(df[df['Quantity'] == 0].index).rename(columns={'Weight': 'Weight (oz.)'})) 我知道query想要做什么，但我不明白为什么需要添加“.index”部分？ .index在这个特定的代码中做了什么？对于上下文，这里是数据帧的样子： ? 我查看了有关dataframe索引的python文档： https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Data

浏览 47提问于2019-10-02得票数 0

1回答

当第3行的数据长度大于标题长度时，Python pandas.readexcel(文件路径，header=[0,1])会失败。欢迎任何解决方案的建议

python、excel、pandas、numpy、dataframe

我已经定义了我的excel(xlsx)的前两行，即0,1作为头文件。为简单起见，excel文件只有一张工作表。在最初的两行之后，文件中的数据行很少。由于有两个头文件，pandas给了我一个多索引的数据帧，这很好。 dataframe = pandas.readexcel(filepath, header=[0,1]) 当一个文件的所有行都达到头的宽度时，上面这行代码就会给我一个有效的数据帧。这是问题所在。在我的一个excel文件中，标题行有65个excel列，有些数据行有66列。熊猫无法执行 dataframe = pandas.readexcel(filepath, header=[0,

浏览 0提问于2018-11-29得票数 0

2回答

搜索相似的单词，将匹配的单词添加到新列中

python、pandas、list、dataframe

我想使用col_one和similar_words这两种列。要用于搜索类似的单词，您将看到，例如，在col_one中，WPH有像similar_words是WP、W、WPH这样的单词，如果找到，就将匹配的单词添加到新列中。大多数时候，名字会在前面，比如禅宗，W，WICE，但是会有一些名字。在名称后面再加上一个符号，如ZEN，ZEN-W2，ZEN13P2302A 我的数据 import pandas as pd list20 = ['ZEN', 'OOP', 'WICE', 'XO', 'WP', 'K&

浏览 6提问于2022-10-09得票数 0

回答已采纳

1回答

可以使用dataframe ix进行赋值，但不能进行检索

python、pandas

我循环遍历pandas df的行，循环索引i。我可以使用ix函数分配几列，其中循环索引作为第一个参数，列名作为第二个参数。但是，当我尝试使用此方法检索/打印时， print(df.ix[i,"Run"]) 我得到一个下面的Typerror: str对象不能解释为整数。在某种程度上与Keyerror有关：“Run” 我不太确定为什么会发生这种情况，因为Run确实是数据帧中的一列。有什么建议吗？ Traceback (most recent call last): File \!"C:\WPy-3670\python-3.6.7.amd64\lib\site-packa

浏览 0提问于2019-07-27得票数 2

1回答

Pandas中的列操作

python、pandas

假设我有一个数据帧： import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(4,5), columns = list('abcde')) 我想从所有其他列中减去列df.a中的条目。换句话说，我想要得到一个数据帧，它包含以下列为列： col_b - col_a| col_c - col_a |col_d - col_a 我尝试过df - df.a，但这产生了一些奇怪的结果： 0 1 2 3 a b c d e 0 NaN NaN NaN NaN NaN

浏览 1提问于2013-02-19得票数 5

回答已采纳

5回答

熊猫的[]和[[]]有什么区别？

python、pandas

我对pandas中的索引列的结果感到困惑。两者都有 db['varname'] 和 db[['varname']] 给我'varname‘的列值。但是，看起来有一些细微的区别，因为db['varname']的输出显示了值的类型。

浏览 2提问于2015-11-20得票数 11

1回答

rpy2如何将R数据分配给值/值

rpy2

如果我将python dataframe转换为r dataframe，则使用：设置 import rpy2.robjects as ro from rpy2.robjects.vectors import ListVector, DataFrame from rpy2.robjects import numpy2ri, pandas2ri from rpy2.robjects.conversion import localconverter from rpy2.robjects.packages import importr base = importr("base") ##

浏览 3提问于2020-08-05得票数 1

回答已采纳

1回答

从具有相同索引和列的两个pandas数据帧执行计算的最快方法

python、python-3.x、pandas

我有两个pandas数据帧，每个都有相同的索引和列。我想创建第三个pandas数据帧，其中包含其他两个细胞的乘积。这是我目前的解决方案，但它太慢了。 import pandas as pd new_df = pd.DataFrame(columns=df1.columns, index=df1.index, data=[]) for col, values in new_df.iteritems(): for idx, value in values.iteritems(): foo = df1.loc[idx][col] bar = df2.l

浏览 10提问于2019-05-11得票数 1

回答已采纳

1回答

将Series传递给Series.map()时的Series.map值

python、pandas

我可能走错路了。我正在寻找大约100家英国医院的邮政编码。我有一个电子表格(all_all)在英国的医院/诊所/等的总数(14,000)和他们的地址和邮政编码。在这100家医院中，我每年都有一个手术活动的数据(脊柱)，医院名称重复了2817行。 spine.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 2818 entries, 0 to 2817 Data columns (total 7 columns): index_col 2818 non-null float64 fyea

浏览 1提问于2019-12-09得票数 1

回答已采纳

1回答

iloc函数在熊猫和Python中有什么优势？

python、python-3.x、pandas

我刚开始学习Python和Pandas，在许多教程中我看到了iloc函数的使用。人们总是说，您可以使用这个函数来引用dataframe中的列和行。但是，您也可以不使用iloc函数直接这样做。下面是一个输出相同的例子： # features is just a dataframe with several rows and columns features = pd.DataFrame(features_standardized) y_train = features.iloc[start:end] [[1]] y_train_noIloc = features [start:end] [[1

浏览 2提问于2020-10-21得票数 2

回答已采纳

1回答

根据pandas中的值获取列索引

python、pandas、series

在pd.DataFrame中查找value并获取该值的列名或索引。值列表包括： [['25362438,25383532 Mobile : 8691017781,8691017798',nan,nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, 'Mobile : 0', nan, nan, nan, nan, nan, nan, nan, nan, nan]] 假设我已经将这个列表转换为pandas df。现在我想知道"

浏览 2提问于2018-05-21得票数 0

1回答

使用Pandas更新行中已存在的新信息的列

python、excel、pandas、dataframe、csv

最终目标是学习如何在任何列中的项发生更改时更新现有的行数据。为此，更新行而不是删除/删除行非常重要，因为在自动从excel中提取信息之后，我必须向每个CSV行输入手动数据。例如，idKey的摘要更改，因此必须用新的摘要更新现有idKey的摘要，而不删除我手动为该idKey输入的事件。另一个例子是，idKey的状态在两天前正在进行分析，而缺陷正在被观察。这个jira现在被关闭为一个副本，idKey的状态现在需要从分析改为复制，而没有我手动输入的ECG构建被删除。我使用Pandas作为我的主库，为传入的行建立数据帧，并操作CSV文件。我已经尝试过一些我见过的东西，但是我发现最有希望的是用于Pa

浏览 8提问于2022-03-10得票数 0

1回答

在Pandas NDArray中返回2D DataFrame.apply

python、pandas、dataframe

我试图沿着一个apply沿DataFrames的行设置一个函数(使用apply和axis=1)。该函数返回一个具有二维的NDArray。我希望返回的apply是一个碰巧包含2D NDArrays的对象列，但我得到的结果是： <venv>/lib/python2.7/site-packages/pandas/core/frame.pyc in _homogenize(data, index, dtype) 5544 v = lib.fast_multiget(v, oindex.values, default=NA) 5545

浏览 2提问于2017-01-11得票数 2

1回答

使用for each比较每个工作簿中的多个列，并将第三列复制到其中一个工作簿

excel、vba、foreach

我正在将新工作簿中的两列与工作簿2中的两列相匹配，然后从Workbook2检索列B并将其复制到新工作簿中的列B。有些单元格将是空的。运行以下代码不会导致任何内容被复制。我不确定我是否使用了正确的方法来检索信息。 Sub InsertDeviceName_NewBook() Dim w1 As Worksheet, w2 As Worksheet, wsnew As Worksheet Dim wbnew As Workbook Dim c As Range, FR As Variant Dim d As Range Dim

浏览 4提问于2020-02-19得票数 0

2回答

根据来自另一列的值查找列中的常用词

python、pandas、string、list、dataframe

在一个包含名为source的列的数据帧中，该列由两个不同的单词列表组成 source words letter_count 1 list1 apple 5 2 list1 pear 4 3 list1 banana 6 4 list2 ford 4 5 list2 chevy 5 6 list2 apple 5 7 list2 banana 6 我正在尝试返回一个新的数据帧，其中显示了list1和list2中的重复单词 words letter_count 1 apple

浏览 6提问于2021-11-20得票数 1

回答已采纳

2回答

使用panda中的read_excel函数遍历excel文件中的所有列

python、pandas

下面的代码读取一列(名为"First")并查找字符串"TOM“。我想要遍历文件中的所有列(而不仅仅是“第一”列)-我想做一些类似excelFilei的事情，其中i和j被设置在一个循环中，但这不起作用。有什么想法吗？ import pandas as pd from pandas import ExcelWriter from pandas import ExcelFile import re excelFile=pd.read_excel("test.xls") for i in excelFile.index: match=re.match(&

浏览 35提问于2018-12-20得票数 0

回答已采纳

1回答

根据系列设置所有列的值

pandas、dataframe、series

我试图将一行的所有值设置为基于另一个dataframe (或从dataframe派生的系列)上的相同值。简单外勤部： df=pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],columns=['a','b','c']) df2=pd.DataFrame([['const',10,'other'],['const',20,'other'],['var',30,'other'],['var',40,'o

浏览 13提问于2022-10-01得票数 0

回答已采纳

1回答

熊猫索引与复制错误

python、pandas

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

1回答

使用.iloc打印包含pandas数据帧的特定列时出现问题

python-3.x、pandas、dataframe、indexing

我使用print(df.iloc[2:][:])创建了一个4x4数据帧，并尝试使用print(df.iloc[:][2:])打印包含所有行数据的最后两列，但它打印的是最后两行和所有列-与pandas相同。我是不是误解了控制台如何解释括号和冒号？下面是我正在执行的代码： import pandas as pd import numpy as np data1 = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16]]) index = ['Worst'

浏览 0提问于2019-01-05得票数 2

2回答

熊猫:当一个列值与另一个DF的列值匹配时，提取DF的行。

python、pandas、dataframe

我有两个DF1和DF2，如下所述。两个dataframe的第一列'POS‘可能有匹配，但其他列则不同。我想比较两个数据格式的'POS‘列，如果DF1的'POS’值在DF2 'POS‘列中，则我希望将该行存储在新的DF1数据格式中，并对DF2执行相同的操作。我可以很容易地通过字典保持POS作为键，并比较它们，以获得相应的值。但是字典不会接受重复的'POS‘值，所以我想知道在Pandas中是否有解决方案。 df1 = POS id freq 0 100 "idex" 3.0 1 102 "ter" 2.0 2

浏览 0提问于2018-12-10得票数 0

回答已采纳

2回答

如果列表包含任何列表，则返回匹配字符串

python、pandas

我正在尝试创建一个新列，用于比较两个列表并返回匹配的字符串。我一直收到错误消息"'list‘对象没有’find‘属性“。我在这方面还是个新手，所以任何帮助都将不胜感激！我正在尝试使用python和pandas来实现这一点到目前为止，我所拥有的是 raw = pd.read_csv(r"") brandnames = ['Amana','Maytag'] raw['Brands'] = [k for k in raw['Description'] if brandnames.find(k)]

浏览 2提问于2019-10-19得票数 0

2回答

从pandas Dataframe中提取在特定列中具有特定值的所有行

python、pandas、dataframe

我是Python/Pandas的新手，正在努力从pd.Dataframe中提取正确的数据。我实际拥有的是一个包含3列的Dataframe： data = Position Letter Value 1 a TRUE 2 f FALSE 3 c TRUE 4 d TRUE 5 k FALSE 我想要做的是将所有真正的行放入一个新的Dataframe中，这样答案将是： answer = Position Letter Value 1 a TRUE 3

浏览 1提问于2013-07-02得票数 11

回答已采纳

1回答

Pandas.dateColumn与Pandas.dateColumn.values的数学计算

python、python-2.7、pandas

在pandas中处理datetime的列时，我们是否直接用整数除列与用整数除列的值有关系吗？ df['mid_date'] = df['start_date'] + (df['end_date'] - df['start_date']) /2 与 df['mid_date'] = df['start_date'] + (df['end_date'] - df['start_date']).values /2 在我的测试中，两者似乎都给出了相同的结果，我想知道哪一个是最

浏览 0提问于2015-10-05得票数 0

1回答

在Excel中，我有两列等于第三列，但它们并不相等。我如何让它们彼此相等？

excel

在Excel中，我有两列等于第三列。如何使前两者相互对应？下面列出的是一个小示例。抱歉，我不知道如何正确地将Excel粘贴到这篇文章中。如您所见，我有标题为UPC、Barcode、RMSID、UPC和Barcode的A-E列。列A和D是UPC的相同值。B和C都对应于UPC列，或者A和D。我希望B和C彼此对应，因为它们都共享A或D的值。因此，如果C和D彼此对应，那么B也对应，我希望在E列中显示这一点。如何在Excel中编写这段代码？ A B C D E UPC Barcode RMSID UPC

浏览 0提问于2016-05-02得票数 0

1回答

pandas groupby count字符串出现在列上

python、pandas、count、group-by、dataframe

我想计算一个分组的pandas dataframe列中字符串的出现次数。假设我有以下数据帧： catA catB scores A X 6-4 RET A X 6-4 6-4 A Y 6-3 RET B Z 6-0 RET B Z 6-1 RET 首先，我想按catA和catB分组。对于这些组中的每个组，我希望在scores列中计算RET的出现次数。结果应该如下所示： catA catB RET A X 1 A

浏览 1提问于2015-07-27得票数 13

回答已采纳

1回答

在熊猫数据中查找特定regex匹配的列和行索引

python、regex、pandas

比方说，我有一只熊猫的数据，里面有字符串内容。找到与特定regex匹配的字符串并返回包含它们各自的行和列索引的元组列表的最佳方法是什么？也就是说， import pandas as pd mydf = pd.DataFrame({'a':['hello', 'world'], 'b': ['hello', 'folks']}) def findIndex(mydf, regex): return regex_indexes 如果我这样做了： regex = r"hello

浏览 0提问于2018-02-05得票数 0

回答已采纳

2回答

获取特定列的行和- Python

python、pandas、sum、row、aggregate-functions

我创建了一个简单的dataset df，它有三列：Area、Year_2010和Year_2020。有关守则： # Import pandas library import pandas as pd # initialize list of lists data = [['Netherlands', 100, 200], ['Belgium', 15, 80], ['Germany', 125, 300]] # Create the pandas DataFrame df = pd.DataFrame(data, columns=[

浏览 3提问于2022-09-13得票数 1

回答已采纳

1回答

Excel:检查列中是否存在单元格值，返回同一行不同列的值

match、excel-formula、vlookup

在检查列中是否存在某个值之后，我希望将同一行中的单元格的值返回到不同的列。具体地说，我正在检查列O中的值是否与列A中的值匹配。如果有，我希望从与列A中匹配的项相同行的单元格中获取相应的值，但这些值位于列f中。然后，我希望从列f中获取这些值，并将它们放在与列O中的值相同的行中。这是我尝试过的公式： =IF(ISNA(MATCH(O2,$A$2:$A$1589,0)),"no match", VLOOKUP(O2,$A$1:$z$14000,16,FALSE)) 这将为列P中的所有单元格返回“不匹配”。我尝试在VLOOKUP函数中修改col_index_num，但我能做的最好的

浏览 3提问于2013-03-01得票数 4

回答已采纳

1回答

使用矢量化的FIltering熊猫数据帧

python-2.7、pandas

我有一个x行y列的数据框，叫做df。我有另一个少于x行和y-1列的datafame df2。我想从第1列到y-1列中过滤与df2相同的行的df。有没有一种方法可以以矢量化的方式做到这一点，而不需要迭代df2的行？以下是示例df的代码： import pandas import numpy.random as rd dates = pandas.date_range('1/1/2000', periods=8) df = pandas.DataFrame(rd.randn(8, 5), index=dates, columns=['call/put', '

浏览 3提问于2014-11-12得票数 1

3回答

VLOOKUP值对公式或函数不可用，但它应该是

excel-formula、excel-2010

我使用以下公式： =VLOOKUP(E9, 'Raw data'!$A$1:$I$45857, 9, FALSE) 我有两个选项卡，我想要第一个工作表中的一列查找‘原始数据’中找到的#值，该值与列E中找到的ID号相关联(数据从单元格E9开始)。我的第二个选项卡'raw data‘包含的字段与从表1中的E9开始的字段相同，数据范围为A1:I45857。我想要从‘原始数据’返回的列是第9列。我只想要精确匹配。我认为excel在想的是-在数组“原始数据”中查找e9，当我看到它时，返回我在数组“原始数据”中找到的行的第9列的值。 excel说明的内容-公式或函数没有可用的值

浏览 0提问于2015-08-12得票数 1

5回答

KeyError:熊猫数据中的错误

python、pandas

import pandas as pd businesses = pd.read_json(businesses_filepath, lines=True, encoding='utf_8') restaurantes = businesses['Restaurants' in businesses['categories']] 我想删除类别列中没有餐馆的行，这个列有列表，但是给出了错误'KeyError: False‘，我想了解为什么和如何解决。

浏览 1提问于2017-07-02得票数 15

回答已采纳