使用现有的列标题将Dataframe1行合并到Dataframe2中- Python Pandas - 腾讯云开发者社区

我的Dataframe1如下所示，以模式和名称作为列标题： Pattern Name Floral Rose Vector Jess Medieval Monica Victorian Marta Floral Jane Vector Monica Vector Elise Medieval Jess Floral Monica 然后我有dataframe2，以名字和排名作为标题： Name Rank Jess

浏览 4提问于2022-02-23得票数 0

回答已采纳

1回答

OneHotEncoder无法使用csr_matrix类型转换(0，1)\t1.0 :不识别

python、pandas、scikit-learn

我有一只熊猫，它的每一栏都是按比例排列的，值是男性还是女性。我的目标是创建2列与OneHotEncoder (按比例男性，按女性)的值1或0适当。我正在使用Azure ML设计器，它使用Execute Python脚本组件，该组件以dataframe作为参数，然后它可以输出2个dataframes。我输入的代码是： # The script MUST contain a function named azureml_main # which is the entry point for this module. # imports up here can be used to impor

浏览 11提问于2022-03-01得票数 0

3回答

熊猫:根据另一列的匹配替换列值

python、python-2.7、pandas、dataframe

我在第一个数据帧df1["ItemType"]中有一列如下所示， Dataframe1 ItemType1 redTomato whitePotato yellowPotato greenCauliflower yellowCauliflower yelloSquash redOnions YellowOnions WhiteOnions yellowCabbage GreenCabbage 我需要根据另一个数据帧创建的字典来替换它。 Dataframe2 ItemType2 newType whitePotato Potato yellowPo

浏览 6提问于2016-07-19得票数 9

回答已采纳

1回答

Pandas:将特定行上的几个列从一个dataframe复制到另一个具有不同名称的列

python-3.x、pandas

我的dataframe1列为a、b、c、d，有5行。我还有另一个dataframe2，它有e、f、g、h列，假设我希望将第3行中的列a、b从dataframe1复制到dataframe2的第3行中的f、g列。我尝试使用以下代码: dataframe2.loc[3，'f'，'g'] = dataframe1.loc[3，'a'，'b']。结果为NaN in dataframe2。有什么办法可以解决吗？

浏览 0提问于2018-07-08得票数 1

回答已采纳

1回答

如何从熊猫的文件中读取列的标签

python、pandas

我真正的问题是，在我使用标题之后，我似乎不能使用标题名称，但我认为这是由于标头错误造成的。我的代码如下： import pandas as pd dataFrame1 = pd.read_csv('C:/Users/Desktop/data/data/featurenames.txt', header=None, encoding='utf-8') dataFrame2 = pd.read_csv('C:/Users/Desktop/data/data/DataSet.txt') dataFrame2.columns=[dataFram

浏览 3提问于2016-02-11得票数 0

1回答

OverflowError:大小不适合整型

python、pandas、dataframe、azure-machine-learning-studio

我正在编写一个在AzureML中使用的python脚本。我的数据集非常大。我有一个数据集，其中的列名为ID(int)和DataType(text)。我希望将这些值连接在一起，只有一列包含由逗号分隔的ID和DataType文本。当我这样做时，我如何避免得到一个错误。我的代码中有没有什么错误？当我运行这段代码时，我得到以下错误： Error 0085: The following error occurred during script evaluation, please view the output log for more information: ---------- Start o

浏览 0提问于2016-02-04得票数 1

2回答

验证Dataframe1的所有行都在Dataframe2中

示例： dataframe1有以下行和列。 +---------+---------+---------+---------+---------+ | Column1 | Column2 | Column3 | Column4 | Column5 | +---------+---------+---------+---------+---------+ | A | B | C | D | E | | P | Q | R | S | T | | J | K

浏览 7提问于2015-07-12得票数 1

回答已采纳

1回答

如何用来自另一个数据框(Pandas)的值更新空的数据框值？

python、python-3.x、pandas、dataframe、numpy

我希望仅当dataframe1中的行为空时，才使用来自dataframe2的等效值更新dataframe1中的空行。案例： ? 图1 ? 图2 在上面的示例中，我只想用dataframe2中等效的Price列填充dataframe1中的Price列的空行。对此有什么想法或建议吗？ import pandas as pd df1 = pd.read_csv('dataframe1.csv') df2 = pd.read_csv('dataframe2.csv')

浏览 16提问于2021-01-05得票数 0

回答已采纳

1回答

根据开始日期和结束日期在数据框架中创建新列

我有以下两个数据帧： Dataframe1 <- data.frame(Time = seq(as.POSIXct("2017-09-06 4:30:00"), as.POSIXct("2017-09-08 15:00:15"), by = "15 min")) Dataframe2 <- data.frame(Start_Date = as.POSIXct(c("2017-09-07 4:32:00", "2017-09-07 13:02:00", "2017-09-08 10:20:00&#

浏览 2提问于2019-06-23得票数 1

回答已采纳

2回答

与其他dataframe列一起筛选dataframe 1列

dataframe、apache-spark、pyspark、databricks

我有包含合同的dataframe1，还有包含工作人员的dataframe2，现在我想用来自dataframe2的列来过滤dataframe1。首先，我尝试用一个字符串过滤dataframe1，它可以工作，这是代码： contract_con=dataframe1.filter(dataframe1.name_of_column.contains('Entretien des espaces naturels') 这是我试图用包含10行的其他dataframe1列过滤相同dataframe2的代码： contract_con=dataframe1.filter(dataframe

浏览 1提问于2022-08-20得票数 0

回答已采纳

1回答

在Azure ML Studio中执行Python脚本模块失败

python-3.x、azure、ml-studio

我在Azure ML Studio中使用了执行Python脚本模块，并编写了最基本的代码： import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): dataframe1["Result"] = dataframe1["3MPurchNo"] * 3 return dataframe1, 如果出现以下错误，它将失败： File "C:\server\XDRReader\xdrwriter3.py", line 190, in write

浏览 3提问于2018-10-04得票数 1

回答已采纳

1回答

我们可以在pandas中使用iloc中的contains属性吗？

python、pandas

Ques :我必须在一组序列中循环，以确定是否有任何序列值包含子集字符串"Hi"？说明:这里有两个数据帧Dataframe1和Dataframe2，我正在尝试查找Dataframe2的“源代码”中是否包含Dataframe1的字符串，并将结果设置为Dataframe3。 import pandas as pd import numpy as np import openpyxl data = {'Fields' : ['Hi', 'How', 'Are', 'You']} Dataframe

浏览 23提问于2019-05-10得票数 1

回答已采纳

3回答

如何根据R中的另一个数据框重命名数据框的所有列？

我对R非常陌生，我正在尝试根据另一个数据帧来重命名一个数据框的列。基本上，我的数据看起来像这样 DataFrame1 A B C D 1 2 3 4 我还有另一张表，看起来像这样‘DataFrame2 Col1 Col2 A E B Q C R D Z 我想根据这个表重命名我的第一个数据框的列，这样它就会显示出来： E Q R Z 1 2 3 4 我正在尝试使用plyr库进行循环。这是我尝试过的命令： library(plyr) for (i in names(DataF

浏览 23提问于2016-07-28得票数 8

回答已采纳

16回答

熊猫获取的行不在其他数据帧中

python、pandas、dataframe

我有两个熊猫数据框，它们有一些共同的行。假设dataframe2是dataframe1的一个子集。如何获取dataframe1中不在dataframe2中的行？ df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 = pandas.DataFrame(data = {'col1' : [1, 2, 3], 'col2' : [10, 11, 12]}) df1 col1 col2 0

浏览 256提问于2015-03-06得票数 325

回答已采纳

0回答

如何根据pyspark中dataframe内的子数组给另一个dataframe的列赋值？

机器学习、python、人工智能、编程算法、spark

dataframe1: +-----+-----+ | index | list | +-----+-----+ | 0 | [0,1] | | 1 | [3] | +----+------+ dataframe1中的list列内的列表是[0,1] 、 [3] ，因此，我想要对dataframe2中id为0、1、3的行的value列赋值为true dataframe2: +-----+-----+ | id | value | +-----+-----+ | 0 | true | | 1

浏览 139提问于2021-01-21

1回答

将一个数据帧中的元素与另一个数据帧中的元素相匹配的巧妙方法？

r、indexing、dataframe、match

假设我有两列x = c("a", "c", "g")和y = c("a", "b", "c", "d", "e", "f", "g")。 X是dataframe1中的列，y是dataframe 2中的列，dataframe1在维度上不一定与dataframe 2匹配。我想返回包含x的y行，例如，我想得到1，3，7。我尝试了一些笨拙的东西，比如items = which(dataframe1$x == dataframe2$y)，但很

浏览 1提问于2012-08-03得票数 0

1回答

根据另一个dataframe列值将dataframe cols和行合并为特定的索引。

python、pandas、dataframe、merge

抱歉，如果标题不够清楚，我会用下面的例子来更好地解释自己： dataframe1 = pd.DataFrame(columns=['UniqueNum', 'B' ,'A']) dataframe1['UniqueNum'] = ['1a','2b', '3c'] dataframe1['A'] = ['2','6', '7'] dataframe1['B'] = ['3','88

浏览 0提问于2019-03-19得票数 1

回答已采纳

2回答

根据特定的行键条件在panda中插入列

python、pandas、insert

我是第一次接触熊猫和蟒蛇。我想在dataframe1中插入一个从dataframe2到dataframe1的列。但是，我的条件是，dataframe2中缺少一些行。因此，我只想插入到那些行键匹配的行中，并将一些空值插入到新列的其余行中。例如：DataFrameExamples 我有超过50K行的数据帧。请告诉我怎么做。谢谢

浏览 39提问于2019-01-07得票数 2

1回答

R数据帧组合

r、dataframe

我知道这是一个常见的问题。然而，在R中组合数据帧时的常见问题是存在重叠的列，并且这些列需要函数。我的问题不是这样的。我目前在R中有两个数据帧，它们有一组完全不同的列，除了两个都共有的ID列。有一个主数据集和一个辅助数据集(这一点很重要，因为并非主数据集中的所有值都存在于辅助数据集中) 我想从辅助数据框向主数据框添加2列。因此，我当前使用的方法是theo iterate，遍历主函数的所有行。检查它是否存在于辅助数据库中，如果存在，则按以下方式添加行 primary$newCol1 <- Secondary$newCol1[Matching stuff here] 主要问题是数据集非常

浏览 0提问于2014-06-09得票数 0

0回答

将数据框列标题和值拆分为多个列

python、pandas、azure-machine-learning-studio

我已经将我的csv文件上传到了Azure上，但由于某种原因，它变成了这样 nominal;data;curs;cdx Column 1 0 1;21.06.2000;28 2300;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 1 1;22.06.2000;28 2200;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 2 1;23.06.2000;28 1900;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 3 1;24.06.2000;28 1700;ï¿½ï

浏览 5提问于2018-07-20得票数 0

回答已采纳

2回答

Pandas:基于列值合并2个数据帧；对于包含相同列值的多个行，将这些数据帧附加到不同的列

python、pandas

我有两个数据帧，dataframe1和dataframe2。它们都在特定的列中共享相同的数据，让我们分别将该列称为“share1”和“share2”，用于dataframe1和dataframe2。问题是，在dataframe1中，“share1”中只有一行具有特定值(让我们称之为“c34z”)，但在dataframe2中，“share2”列中有多行具有值“c34z”。我想要做的是，在新的合并数据帧中，当有新值时，我只想将它们放在一个新列中。因此，新数据帧中的列数将是'share2‘中特定值的最大重复数。对于在“share2”中只有唯一值的行，对于该行，其余添加的列将为空。

浏览 29提问于2019-04-21得票数 0

回答已采纳

1回答

一个新手，认为我对R有一个很好的理解，但是

r、dataframe

我已经在R上编程了大约4/6个月，我认为我对R有了一个很好的理解，但今天之后(在网上花了很多小时都找不到我的问题的解决方案)，我感觉自己像狗屎一样。:( 在一个函数中，我只想在一个数据框中添加2列。我意识到这对你们中的许多人来说似乎很简单，但我花了几个小时在网上试图找到答案，但没有找到为什么我的代码是错误的。我的数据框是： dataframe1 <- data.frame(V1=1:10,V2=11:20,V3=21:30,V4=31:40); 首先，我尝试了以下函数： y <- function(data,a,b){ V5 <- data$a + data$b; p

浏览 0提问于2014-11-02得票数 1

1回答

如何将多个数据帧中的单个列重命名为它们在R中所在的数据帧的名称？

r、dataframe、naming

我目前正在尝试重命名多个dataframe中的单个列，以匹配R中的dataframe名称。我在网站上看到了一些问题/解决方案，这些问题/解决方案与我正在尝试做的事情相似，但似乎没有一个是动态完成的。我有超过45个数据帧需要重命名其中的一个列，因此手动输入每个单独的名称是可行的，但很耗时。 Dataframe1 <- column Dataframe2 <- column Dataframe3 <- column I want it to look like this: Dataframe1 <- Dataframe1 Dataframe2 <- Datafr

浏览 0提问于2019-11-07得票数 0

2回答

使用行索引向量组合数据帧

r、dataframe、vector、dplyr、subset

我有dataframe1和行索引的向量： dataframe1 <-data.frame(time = c(0.5, 1.5, 2.5, 3.5, 4.5, 5), x = c("light", "light", "light", "dark", "dark", "dark")) vector <- c(1, 3, 6) 我还有dataframe2 dataframe2 <- data.frame(time = c(0.6, 1, 1

浏览 2提问于2021-06-16得票数 0

回答已采纳

1回答

根据其他数据帧中的列表设置数据帧

r、dataframe、subset

我有三个data.frame，每个都有一个名为col的列。我想过滤掉DataFrame1的所有行，col的值(例如a、b、c和d )出现在DataFrame2中。我用的是 subset(DataFrame1, !(col %in% DataFrame2$col)) DataFrame3包含值列表，例如a;b;c、col中的c;d;a。在本例中，我还希望根据DataFrame1中a、b、c和d的出现情况来过滤DataFrame3。在进行匹配之前，如何展开值列表？数据大致如下： DataFrame1 DataFrame2 DataFrame3 col data col data co

浏览 0提问于2019-03-03得票数 0

回答已采纳

2回答

如何从python字典中的多个数据帧中筛选出行

python、python-3.x、pandas、dictionary

我有一个包含许多dictionary的dataframes。样本数据： dataframe1 = pd.DataFrame({"variable1":["a","a","b"]}) dataframe2 = pd.DataFrame({"variable1":["b","a","b"]}) dictionary = dict(zip(["dataframe1","dataframe2"],[dataframe1,dataframe2]

浏览 1提问于2017-09-15得票数 2

回答已采纳

1回答

R中不同维数的数据帧映射

r、filter、mapping

我有两个数据帧。第一个列有一个列和1000行。包含此数据帧的值属于区间(0，1)。第二个数据框架有3列，5行如下形式： From To Category 0.0 0.2 1 0.2 0.4 2 0.4 0.6 3 0.6 0.8 4 0.8 1.0 5 我试图通过以下R代码将Category值赋值/映射到第一个数据帧的值： for (i in (1:nrow(DataFrame1))){ for (j in (1:(nrow(DataFrame2)))){ if ( (Data

浏览 1提问于2018-05-11得票数 0

回答已采纳

1回答

比较Azure ML分类器的brier分数

python、python-3.x、azure、azure-machine-learning-studio

我正在尝试比较Azure ML studio中两个分类器的brier分数： import pandas as pd import numpy as np from sklearn.metrics import brier_score_loss def azureml_main(dataframe1, dataframe2): colnames_1 = dataframe1.columns y_true_1 = np.array(dataframe1[colnames_1[1]]) y_prob_1 = np.array(dataframe1[colnames_1[-1

浏览 7提问于2017-03-17得票数 0

回答已采纳

1回答

Python按索引连接数据帧

python、pandas、dataframe

我正在使用Python中的多个数据帧，并希望基于一个公共列将一个数据帧映射到另一个数据帧(类似于Excel中的索引/匹配)。我希望将一个数据帧的date列连接到另一个数据帧的index (其中日期存储为索引)。我如何调用索引呢？作为参考，我想从DataFrame1 (S&P 500)中减去DataFrame2 (awk_price)的ROI。数据帧如下所示。我目前有一个合并的数据帧，使用 pd.merge(awk_price,sp_500, left_index=True, right_on='Date') 我只想在df2中添加一列，用DataFrame1中的ROI

浏览 22提问于2021-03-25得票数 4

1回答

Azure机器学习工作室设计器错误: code_expired

python、azure-machine-learning-studio、azure-machine-learning-service

我正在尝试通过Azure Machine Learning Studio设计器注册数据集，但一直收到错误。下面是我的代码，在“执行Python脚本”模块中使用： import pandas as pd from azureml.core.dataset import Dataset from azureml.core import Workspace def azureml_main(dataframe1 = None, dataframe2 = None): ws = Workspace.get(name = <my_workspace_name>, subscrip

浏览 15提问于2021-08-04得票数 1

回答已采纳

1回答

如何在Azure ML中使用python从S3读取数据

python、pandas、azure、dataframe、azure-machine-learning-studio

import boto3 import io import pandas as pd # The entry point function can contain up to two input arguments: # Param<dataframe1>: a pandas.DataFrame # Param<dataframe2>: a pandas.DataFrame def azureml_main(dataframe1 = None, dataframe2 = None): s3 = boto3.client('s3',

浏览 0提问于2018-04-28得票数 0

2回答

将R中的两个数据帧中的单个列合并，其中只有一些行匹配

我正在尝试将数据从一个数据帧中的一个列合并到另一个数据帧中的另一个列中，使用一个具有共享数据的列作为操作的关键。我已经尝试过关于如何在r中复制Excel的几个不同的教程，并且我尝试了这里提供的几种不同的合并方法(在stackoverflow...but上的答案中)，到目前为止，我没有尝试过做我想要做的事情，尽管它似乎是相当常见的函数。下面是我尝试do...to提供的一个非常简单的例子，假设这是dataframe1： ID RESULT 4 YES 1 YES 3 NO 2 YES 下面是dataframe2，其中的结果列完全由NAs

浏览 3提问于2015-02-10得票数 1

回答已采纳

1回答

在R中使用反连接

text-mining

我是R中的一个菜鸟，我试着比较两个数据帧，这两个数据帧是通过文本挖掘得到的，它有两列，一列有单词，另一列有计数。假设它们是dataframe1和dataframe2。我试图找出如何编写代码，以选择那些单词在dataframe2中存在，而在dataframe1中不存在。如果我们必须在excel中使用它，我们只需在dataframe2和VLOOKUP中使用word作为引用，从dataframe1中选择相同的单词列表，并选择存在的#N/A，然后根据最高计数对#N/A进行排序。下面是详细说明的图片: dataframe1 dataframe2：如您所见，C&F一词在

浏览 1提问于2021-04-23得票数 0

回答已采纳

2回答

在两个dataframe之间选择一些值

我有两个数据序列，一个有100个基因的列，另一个有一个由700行组成的列，每一行都有几个用逗号分隔的基因，现在我不知道如何能够根据dataframe 1中的基因列来选择每一行dataframe 2中的基因。换句话说，我希望在dataframe 1的基因列中每一行都有基因。 dataframe1: column gene: a b c d e f dataframe2: column gene: row1"a,b,c,d,r,t,y" row2"c,g,h,k,l,a,b,c,p" 我只想在dataframe2的每一行中分离逗号分离的基因，这些基因位于data

浏览 4提问于2021-06-28得票数 1

回答已采纳

1回答

如果数据帧存在于另一数据帧列中，则搜索该数据帧的子串

python、pandas、string、dataframe、string-comparison

我需要一些帮助，在dataframe1的化学物质列中搜索字符串或子字符串，并检查它是否存在于dataframe2中，然后在dataframe1中创建一个新列，以从dataframe2返回相应的化学物质名称列。有人能帮上忙吗？谢谢

浏览 6提问于2020-10-07得票数 0

回答已采纳

2回答

迭代多个数据文件的合并

python、pandas、loops、for-loop、merge

我正在尝试构建一个循环，它将采用不同的数据帧并合并到单个“主”数据框架上。每个单独的数据都是无序的，我想将它们与主数据帧的CAS列中的值对齐。示例主数据帧示例数据帧1: 示例数据帧2: [ ] 实际数据硕士DataFrame DataFrame1 DataFrame2

浏览 4提问于2020-08-02得票数 0

回答已采纳

1回答

使用ID连接特定列上的2个数据帧

python、pandas

我有两个数据帧(pandas/python) --见图。我正在尝试组合dataframe1和dataframe2来生成dataframe3，连接在'record_id‘列上。有没有办法用熊猫来做这件事？提前感谢您的帮助！

浏览 0提问于2013-06-21得票数 1

回答已采纳

1回答

Pandas在单独的Dataframes中比较列，然后在1 DataFrame中删除不匹配的行。

python、pandas

我想比较两列在不同的数据，然后删除整个不匹配的行. 这两列的长度不一样。下面是DataFrame #1的一个模拟： 📷 下面是DataFrame #2的一个模拟： 📷 我希望比较2 DataFrames中的DataFrames列，如果在DataFrame #2中找不到行值，则删除DataFrame #1中的整行。目前，我的代码不起作用： DataFrame1 = np.where((DataFrame1["ID_NUMBER"] == DataFrame2["ID_NUMBER"])) 事先非常感谢！

浏览 0提问于2021-11-04得票数 0

回答已采纳

1回答

制作作为两个数据帧的子集的数据帧

我又被难住了。我有两个数据帧 dataframe1 a b c [1] 21 12 22 [2] 11 9 6 [3] 4 6 7 和 dataframe2 f g h [1] 21 12 22 [2] 11 9 6 [3] 4 6 7 我想获取dataframe1的第一列并创建三个新的数据帧，第二列是f、g和h中的每一列显然，我可以一遍又一遍地做一个子集 subset1 <- cbind(dataframe1[,1]dataframe2[,1]) subse

浏览 0提问于2013-06-04得票数 3

回答已采纳

1回答

Azure Machine Learning Studio designer -注册数据集时意外地“创建新版本”

python、azure-machine-learning-studio、azure-machine-learning-service

我正在尝试将一个数据集注册为一个Python步骤，并使用Azure设计器。这是我的代码： import pandas as pd from azureml.core import Workspace, Run, Dataset def azureml_main(dataframe1 = None, dataframe2 = None): run = Run.get_context() ws = run. experiment.workspace ds = Dataset.from_pandas_dataframe(dataframe1) ds.register

浏览 2提问于2021-08-04得票数 2

回答已采纳

1回答

通过将不同数据帧的列值和标量传递给Pandas Python中的函数，在第二个数据帧中创建新列？

python、pandas、dataframe

我的dataframe1包含day列，它包含一周中每一天从1到7的数字数据。1-星期一，2- Tuesday...etc。此day列是航班的起飞日期。我需要在第二个dataframe2中创建一个新列dayOfBooking，它根据一个人预订航班前的天数和航班起飞日期查找星期几。为此，我编写了这个函数： def findDay(dayOfDeparture, beforeDay): beforeDay = int(beforeDay) beforeDay = beforeDay % 7 if((dayOfDeparture - beforeDay) > 0):

浏览 2提问于2016-12-06得票数 0

1回答

在for循环中追加数据帧中的行

pandas

我有一个长度为4000的Dataframe1，还有一个长度为600的列表。我希望将该列表与Dataframe1中的列进行比较，如果它们具有相同的值，则将Dataframe1的行移至Dataframe2，如果不同，则将其移至Dataframe3 这是我的代码，但它需要永远运行，谁能推荐一个更快的解决方案。 for i in range(len(Dataframe1)): for j in range(len(list)): if Dataframe1['Column'][i] == list[j]: Datafram2 =

浏览 7提问于2020-05-15得票数 0

3回答

如何基于多个栏和条件来填充大熊猫DataFrame？

python、pandas、dataframe

我目前正在从事一个业余项目，但我被困在熊猫中植入DataFrame。我有三个DataFrames。我的问题：对于DataFrame1中的每个DataFrame1，如果列m等于1，则将列n添加到DataFrame3中的x列中。对于DataFrame1中的每个DataFrame1和DataFrame2将列y设置为1，如果DataFrame1中的列c等于1，或者DataFrame2中的列d等于1。c等于99具有最高优先级，并将y设置为99 有人能帮帮我吗？ DataFrame1 | id | n | m | c | |--------|------

浏览 0提问于2019-04-12得票数 0

回答已采纳

1回答

在不丢失R中的数据的情况下，在多个数据中保持前10%的观测值

r、subset、dplyr、rbind

我在重新绑定时出了问题。同时填充多个数据文件，同时删除它们。我的一般数据帧是1倍(6000->60,000)，其中单行是给定的纪念(林肯纪念堂)，列是Yelp和Trip Advisor上每一次评论中的每个单词对，其数量是单词对出现的次数。我想把它减少到前10%的单词对，同时也不会失去这样的机会:在一个词对中最低的90%在另一个中排在前10%。 four_score = c(60) seven_years = c(100) dataframe1 <- data.frame(four_score,seven_years) seven_years = c(10) our_fathe

浏览 0提问于2015-09-12得票数 0

回答已采纳

1回答

根据多列条件从另一个数据框中更新某列的某些值

python、python-3.x、pandas、dataframe

我的dataframe1： id filler ent seg val text 1 M,0-10 CP BEC 20 abc 2 M,10-20 D BWC 30 abc 3 Y,0-10 CP CCD 40 abc 4 Y,10-20 D CFC 50 abc dataframe2： id filler ent seg val te

浏览 11提问于2020-12-05得票数 0

4回答

匹配列标题并重命名为附加列名的字符串

我想用不同的字符串追加dataframe1的列标题。我有另一个dataframe2，它包含列名和要追加的字符串。如何在dataframe1中添加列名？ dataframe1: id C1_A C2_A C3_A C4_A C5_A 11 0 0 0 1 2 12 0 3 2 1 0 13 2 0 0 2 3 14 0 0 2 1 1 dataframe2 C S C1_A HP C2_A LP C3_A KP C4_A KP C5_A H

浏览 8提问于2017-11-01得票数 1

回答已采纳

1回答

根据两个R中的匹配列将column1 (dataframe1)从column2 (dataframe2)中减去

r、dataframe、matching

Dataframe1有两列: num_movies和userId。Dataframe2有两列: No_movies和userId。但是Dataframe2有2106行，而Dataframe1有1679行。我想根据匹配的userId值从Dataframe1中减去Dataframe2中的电影数量。我写了下面这行： df1$num_movies = df1$num_movies - df2$No_movies[df1$userId %in% df2$userId] 我得到了以下错误： Error in `$<-.data.frame`(`*tmp*`, "num_movies"

浏览 1提问于2015-06-09得票数 0

2回答

从给定日期提取月份和年份的方法

python、azure

在过去的几天里，我一直在蓝色的毫升工作。我想出了一个由以下格式的日期组成的数据集 mm/dd/yyyy hh:mm:ss 我想通过用azure编写python代码来提取月份和年份。我正在尝试以下代码： def azureml_main(dataframe1 = None, dataframe2 = None): import pandas as pd dates = pd.to_datetime(dataframe1['Order Date']) dates = dates.apply(lambda x: x.strftime('%m-%

浏览 0提问于2018-05-02得票数 0

回答已采纳

1回答

如何连接来自pandas.read_html的结果列表

python、pandas、dataframe

我可以使用下面的代码从一个URL打印/获取CSV数据 import bs4 as bs import pandas as pd dfs = pd.read_html('http://www.url1.com',header=0) for df in dfs: print(df.head()) df.to_csv('File.csv') 我想把多个数据连接在一起。 dataframe1来自 dataframe2来自 ..。 dataframeN来自将所有数据文件合并到一个单独的文件中，并将其导出到“file.csv”。

浏览 2提问于2018-04-14得票数 2

回答已采纳

1回答

根据dataframe2中列表中的值更新dataframe1中的单元格

python

我有一个具有列的dataframe1，它的单元格条目类似于- "are, boy, cat, dog, ear, far, gone" (每个单元格是一组逗号分隔的单词)。 Dataframe2有一个列，其中包含像这样的单元格条目(每个单元格是一个字母或单词)- "are"、"boy"或"gone"。我想在dataframe1中添加一个列，如果dataframe1中的每个单元格中的每个单词都包含dataframe2中的单词，则该列将具有布尔值条目。例如, DF1 =(是，男孩，猫，狗，耳朵，远，走了)，(家，家伙，高，蛋)，(猫

浏览 0提问于2021-10-10得票数 0