在dataframe列中创建0到0之前的所有条目_Python -在dataframe的第一列的所有行中获取0_将pandas dataframe中的空格替换为所有列中的0 - 腾讯云开发者社区

r、dataframe、dplyr、subset

我试图找到一种方法来识别数据帧中的列，这些列的任何条目都等于0。如果该特定列的值等于0，我希望创建一个新的数据框架，而不包含零值的列。此外，我希望创建保留的列和删除的列的列表。 Example: dataframe1: Column1 Column2 Column3 Column4 .03 .05 .07 .08 .01 .09 .22 .39 0 .56 .88 .56

浏览 0提问于2019-03-16得票数 0

回答已采纳

1回答

按字符在Python/Pandas DataFrame的列中索引

python、pandas、indexing、dataframe

我正在做一个项目，在这个项目中，我从ESPN中抓取NBA数据，并创建了一个DataFrame来存储它。我的DataFrame的专栏之一是团队。某些在一个赛季内被交易的球员有一个价值，比如在球队中的LAL/LAC，而不仅仅是像LAL这样的球队名字。对于这些行数据，我想创建两个条目而不是一个条目。这两个条目将具有相同的原始数据，但其中一个条目的团队名称将为LAL，而另一个条目的组名为LAC。一些团队缩写是2个字母，而另一些是3个字母。我已经成功地创建了一个单独的DataFrame，其中只包含了在team2 1/team2 2表单中有值的数据行。我想出了一种获取数据的好方法--首先用多个团队条目复

浏览 1提问于2016-01-13得票数 1

回答已采纳

2回答

使用np.where的For循环

python、pandas、numpy、dataframe、where

我正在尝试在一个数据帧中创建一个新列，用于标记用1驯养的动物。我使用了一个for循环，但由于某些原因，该循环只提取pets列表中的最后一项。dog、cat和gerbil都应该在domesticated列下分配1。有人有解决这个问题的办法或者更好的方法吗？ df = pd.DataFrame( {'creature': ['dog', 'cat', 'gerbil', 'mouse', 'donkey'] }) pets = ['dog', 'cat'

浏览 55提问于2019-03-21得票数 0

回答已采纳

2回答

使用2个独立的DataFrames构建带有字符串项的Pandas DataFrame

python-3.x、pandas、dataframe、concatenation

假设您有两个独立的pandas DataFrames，它们具有相同的行和列索引(在我的例子中，列索引是通过对使用df.groupby(col1，col2)构建的MultiIndex执行.unstack()来构建的)。 df1 = pd.DataFrame({'a':[.01,.02,.03],'b':[.04,.05,.06]}) df2 = pd.DataFrame({'a':[.04,.05,.06],'b':[.01,.02,.03]}) 现在假设我想创建第三个DataFrame，df3，其中df3的每个条目都是一个字符串，

浏览 13提问于2019-11-19得票数 1

2回答

如何组合Python / Pandas中的两个指示符列，其中逻辑取决于行的排序

python、pandas、loops

我正在尝试创建一个列，该列在每个入口和出口之间选择所有日期。每个条目只与一个出口配对。因此，当窗口函数看到一个条目，即1/4/2019，它打开'1‘，直到它看到出口1/6/2019。第二天就关掉了“0”。它忽略所有出口(即1/6/2019)，直到它看到下一项，即1/9/2019，然后开始记录“1”，直到下一个出口，即1/11/2019。日期是从最近的日期到第一次约会的顺序。 import pandas as pd import numpy df = pd.DataFrame({'Entry':[0,0,0,1,0 ,0,0,0,1,0,0,1]

浏览 0提问于2019-02-13得票数 0

回答已采纳

2回答

用不同列中的值填充新列

python、pandas

假设我有一个这样的数据帧：dataframe 如果我必须创建一个新列，其中包含列3中的值，如SO4 N/A -1.135632 -1.044236 1.071804 0.271860 -1.087401 0.524988 -1.039268 0.844885 -1.469388 -0.968914 即，列4的条目1被列3的条目0填充，列4的条目2被列3的条目1填充，因此第4列中的第n个条目被第3列的第(n-1)个条目填充

浏览 19提问于2021-11-12得票数 2

回答已采纳

1回答

用熊猫制作两本字典

pandas、dataframe、dictionary

df = pd.DataFrame({'A':['a_o','a','b_o','b','c'],'B':[1,0,1,1,0],'C':[99,24,67,89,91]}) 对于上面的dataframe df，我想做两个字典，如下所示： dict1 = {'a_o':99,'b_o':67} dict2 = {'a':0,'b':1,''c':0} 我想要做的是，对于'

浏览 2提问于2022-07-25得票数 1

回答已采纳

1回答

如何在Pandas中将n列合并为1行

python、pandas

我有一个包含大约40列和超过150 K行的DataFrame，我想将它们合并成一个列。DataFrame的NaN值遍布各地。下面是我的df的一个示例： d = {'A' : pd.Series([np.nan, 5., 3.], index=[0,1,2]), 'B' : pd.Series([np.nan, 2., np.nan], index=[0,1,2]), 'C' : pd.Series([1.,np.nan, 4.], index=[0,1,2])} df = pd.DataFrame(d) A B C

浏览 2提问于2016-12-15得票数 0

回答已采纳

1回答

如何选择从spacy实体中提取的第一个实体？

python、pandas、for-loop、spacy

我试图使用下面的代码从DataFrame中可用的文本中提取实体。 for i in df['Text'].to_list(): doc = nlp(i) for entity in doc.ents: if entity.label_ == 'GPE': 我需要用对应的文本列来存储第一个GPE的文本。例如，如果下面是df['Text']列中索引0处的文本美国和加拿大的比赛被推迟然后，我只需要第一个位置(美国)在另一列，如df['Place']对应的索引文本，即0。df['Place&

浏览 3提问于2020-12-22得票数 2

回答已采纳

1回答

基于过滤器的熊猫DataFrame新栏目的制作

python、pandas、dataframe

考虑到这个DataFrame： df = pandas.DataFrame({"a": [1,10,20,3,10], "b": [50,60,55,0,0], "c": [1,30,1,0,0]}) 如果列a和b中的值都大于x，那么创建一个具有值"pass“的新列"filter”的最佳方法是什么？它可以通过遍历行来实现，但它效率低下且不优雅： c = [] for x, v in df.iterrows(): if v["a"] >= 20 and v["b"] >= 2

浏览 1提问于2014-11-09得票数 1

回答已采纳

2回答

如何在R的dataframe中缩写长名？

r、dataframe、abbreviation

我正在使用一个有超过25个字符的长名称的dataframe。我试着用所有这些组织的名字制作一个条形图(用巧妙的方式)，但是这些名字被切断了，因为它们是超长的。我已经尝试过这样做： plot_ly(x = number, y = org_name, type = 'bar') %>% layout(margin = list(l = 150)) 它很有效，但是条形图看起来不太好，所以我想要做的另一种方法是缩写任何超过25个字符的组织名称。然而，我很难做到这一点。我试图简化它的一种方法是创建一个名为abbrv的新列，使用子字符串获取组织名称的前25个字符，然后执行“.”，然

浏览 3提问于2017-11-30得票数 3

回答已采纳

5回答

在pandas DataFrame中对列执行.str.split()操作后获取最后一个" column“

python、string、pandas、split

我在pandas DataFrame中有一列，我想将其拆分到一个空格中。使用DataFrame.str.split(' ')拆分非常简单，但是我不能从最后一个条目创建新的列。当我对列执行.str.split()操作时，我得到了一个数组列表，但是我不知道如何处理它来为我的DataFrame获得一个新的列。下面是一个例子。列中的每个条目都包含‘符号数据价格’，我想拆分价格(并最终删除"p"...或"c“在一半的情况下)。 import pandas as pd temp = pd.DataFrame({'ticker' : ['sp

浏览 1提问于2012-09-20得票数 103

回答已采纳

1回答

从Python中的dataframe列中读取键和值

python、pandas、dataframe、dictionary

我有一个csv文件，它有两列。一个给时隙，一个给能量。我把这个文件放进了熊猫的资料里，我附上了这张照片的截图。现在，我希望有一个字典，它的键值是来自一列的条目，也是来自另一列的条目。我尝试了这里提到的所有选项，，但没有成功。在这里你可以看到我的代码和我的尝试。我指出了想要的字典： import pyomo.environ as pyo import pandas as pd #Define the model model = pyo.ConcreteModel() #Define the sets model.set_timeslots = pyo.RangeSet(0,9

浏览 1提问于2021-02-19得票数 1

回答已采纳

2回答

向100K+数据集添加行

python、pandas、dataset、data-science

我对Python和数据科学非常陌生。我有一个包含30列的100K+ CSV数据集。目标是在满足某些条件的情况下向数据集添加一些行。为了让事情变得更简单，假设我只有三列名为"A“、"B”和"C"，A和B的类型是整数。C是一根线。让我们不要担心B和C，因为im会将所有B列值设为0，im将在稍后计算C。下面是我的“想象”数据集的快速视图： A _____ | 1 | | 4 | | 3 | | 7 | _______ 我在Dataframe中解析了我的数据集，并根据"A“的值对其进行了排序。所以，现在，看起来是这样： A

浏览 0提问于2019-10-11得票数 1

回答已采纳

2回答

如何将4列数据作为矩阵表示，其中0列指定行，列1-2指定列范围，第3列指定条目。

python、pandas、dataframe

我有一个四列数据框架，如下所示:零列包含从列表['A','B','C','D']中选择的文本标签，并可能重复。列1-2标记为start和stop，前者小于后者，第三列intensity是浮点数。对于每个标签，没有使用start、stop形成的相应间隔重叠。以下是一个简单的例子： import numpy as np import pandas as pd labels=['A','B','C','D'] d = {'label': ['A&#

浏览 3提问于2022-02-10得票数 -1

回答已采纳

1回答

基于时间序列的mysql/pandas数据更新列

mysql、python-3.x、pandas

假设一个表有3列: orderid、entry和time。对于每个orderid，在打开订单和关闭订单时，将有2个条目。在默认情况下，条目为0，我希望更新该条目，使其稍后时间为1。如果orderid只出现一次，这意味着这个顺序仍然是打开的，因此条目应该保持为0。无论如何，我可以使用更新查询来完成它吗？编辑：我发现在MYSQL中运行update查询效率极低，因为这个表很大，并且不断插入新的数据。由于我在将DataFrame插入到表中之前使用Python大熊猫来生成它，那么在DataFrame中有什么方法可以做到吗？所以 order = [(11111,0,'2020-

浏览 3提问于2020-09-30得票数 1

回答已采纳

1回答

一次在sql表的多列中插入R代码输出(Dataframe)

r、sql-server、dataframe

例如，我创建了一个列名为" names“、"Class”、"age“的SQL表，并且我使用R代码创建了一个数据框架： data_structure1<- as.data.frame("Name") data_structure1 data_structure2<-as.data.frame("Class") data_structure2 data_structure3<-as.data.frame("age") data_structure3 final_df<- cbind(data_struc

浏览 4提问于2022-05-12得票数 0

2回答

如何计算由某个组变量聚合的percentage中特定列的零百分比

python、pandas、dataframe、pyspark、apache-spark-sql

我有一个具有下列列的 source_cd Day Date hour five_min_block five_min_block_volume 在此，日期从2020年1月31日至2021年3月31日不等。相应地，也有“日”字段。另外，source_cd有5个类别，每个唯一日期的时间从0到23不等，相应的five_min_block从1到12不等。然后我的值列被命名为five_min_block_volume。现在这个five_min_block_volume字段中可以有任何值，从0开始到任何正定数。我想要做的是，当按特定的groupby变量进行聚合时，计算这个列的零百分比(

浏览 6提问于2022-09-06得票数 2

1回答

根据dataframe2中列表中的值更新dataframe1中的单元格

python

我有一个具有列的dataframe1，它的单元格条目类似于- "are, boy, cat, dog, ear, far, gone" (每个单元格是一组逗号分隔的单词)。 Dataframe2有一个列，其中包含像这样的单元格条目(每个单元格是一个字母或单词)- "are"、"boy"或"gone"。我想在dataframe1中添加一个列，如果dataframe1中的每个单元格中的每个单词都包含dataframe2中的单词，则该列将具有布尔值条目。例如, DF1 =(是，男孩，猫，狗，耳朵，远，走了)，(家，家伙，高，蛋)，(猫

浏览 0提问于2021-10-10得票数 0

1回答

为什么火花MLlib HashingTF只输出一维矢量？

scala、apache-spark、dataframe、apache-spark-mllib、apache-spark-ml

所以我有一个大的数据格式：数据格式：org.apache.spark.sql.DataFrame = [id: string, data: string] 数据是一组非常大的单词/标识符。它还包含了不必要的符号，如[{等]，我需要清理。我的解决办法是： val dataframe2 = sqlContext.createDataFrame(dataframe.map(x=> Row(x.getString(0), x.getAs[String](1).replaceAll("[^a-zA-Z,_:]",""))), dataframe.schema)

浏览 0提问于2016-09-24得票数 1

回答已采纳

1回答

熊猫如何在不寻常的文本顺序中分解

python、pandas、categorical-data、one-hot-encoding

我有一个dataframe，它有一个列'cat100‘，其值如下所示： “B”..。'Y‘Z’'AA‘AB’。我想使用pd.factorize分解列，使AA在'B‘'C’之后。“z”。我试过这样的方法： df = pd.DataFrame(['A','B','AA']) df[0] = pd.factorize(df[0], sort=True)[0] 但是，这分配A到0，B到2，AA到1。我希望AA被分配到2和B到1。我一直在寻找做这件事的方法，却什么也没找到。有办法这样做吗？

浏览 2提问于2016-11-11得票数 2

回答已采纳

1回答

如何动态地指示DataFrame中一组条件的开始和结束？

python、pandas、loops、list-comprehension

我试图在dataframe中创建一个指示器列，该列查看输入和退出列的值，并创建一个具有以下逻辑的窗口：查找条目为1 (1/3/2019)的最早日期，并将窗口标记为1。窗口保持1，直到出口为1 (1/5/2019)。然后窗口变为0，直到它找到下一个条目值等于1 (1/8/2019)。此过程在DataFrame中一直重复到最近的日期。因此，对于窗口列，一个出口必须跟随并输入，或者对于每个条目，最终都会有一个出口(参见下面的示例)。还请注意，日期索引的顺序是相反的。 df = pd.DataFrame({'C1':[5,3,4,5,4,2,1,4,5

浏览 0提问于2019-02-12得票数 0

1回答

计算pandas Dataframe中不同行的单元格之间的差异

python、pandas、numpy

我在熊猫中有一个数据帧，如下所示： Timestamp ID X X Diff Y Y Diff 0 0 100 1.728 None 14.378 None 1 12 100 2.035 None 14.378 None 2 24 100 2.342 None 14.378 None 3 36 100 2.630 None 14.378 None 4 48 100 2.9

浏览 20提问于2021-07-17得票数 1

回答已采纳

1回答

取pandas数据帧中多列的平均值

python、pandas、mean

我有一个具有4列的pandas数据帧，这是一台设备如何将数据导出到csv。我的当前代码获取csv，将其导入到dataframe中，向列添加标题，然后在其上运行一些代码以按照我们需要的方式对其进行转换。以下是代码的主要部分： def data_an(info): data = pd.read_csv(info, usecols=[0, 1, 2, 3], names=["a", "b", "c", "d"]) data = data.replace(0, np.NaN) return(data.mean(),

浏览 1提问于2020-06-16得票数 0

3回答

在Pandas DataFrame中拆分列列表

python-3.x、pandas、dataframe、pandas-groupby

我正在寻找一个很好的方法来解决以下问题。我目前的解决办法不是特别干净，我希望从你的洞察力中吸取教训。假设我有一个Panda DataFrame，其条目如下所示： >>> df=pd.DataFrame(index=[1,2,3],columns=['Color','Texture','IsGlass']) >>> df['Color']=[np.nan,['Red','Blue'],['Blue', 'Green', '

浏览 3提问于2017-10-25得票数 2

回答已采纳

1回答

Apache Ignite和Apache Spark集成，使用IgniteRDD将缓存加载到Spark上下文中

ignite

如果我在我的spark作业中创建了一个有10M个条目的缓存之外的igniteRDD，它会将所有10M条目加载到我的spark上下文中吗？请在下面找到我的代码以供参考。 SparkConf conf = new SparkConf().setAppName("IgniteSparkIntgr").setMaster("local"); JavaSparkContext context = new JavaSparkContext(conf); JavaIgniteContext<Integer, Subscribe

浏览 1提问于2016-04-06得票数 2

3回答

从生成器列表创建Pandas Dataframe

python、pandas、dataframe、generator

我必须回答以下问题。是否有一种方法可以从对象列表构建DataFrame。我使用列表理解为dataframe创建包含数据的列表： data_list.append([record.Timestamp,record.Value, record.Name, record.desc] for record in records) 我是这样做的，因为附加在for循环中的普通列表花费了大约20倍的时间： for record in records: data_list.append(record.Timestamp,record.Value, record.Name, record.desc) 我

浏览 3提问于2020-03-02得票数 0

回答已采纳

1回答

pandas.read_excel为列导入错误的值

python、excel、pandas、data-analysis

我使用pandas.read_excel将excel文件导入到DataFrame中。这是密码..。 #!/usr/bin/python import pandas as pd file = 'sample.xls' df = pd.read_excel(file, sheetname=0, skiprows=7) 这将导入该文件，但有以下警告..。警告* OLE2流'SSCS'：预期大小128640，实际大小512 当我打印dataframe时，我看到最后一列的值是完全错误的(而不是该列中的实际值，而是显示了每一行4。我正在附加xls文件的屏幕抓取。

浏览 3提问于2017-03-10得票数 0

回答已采纳

1回答

动态设置变量名的适当时间？

python、pandas、dataframe

编辑:原来答案是强调“不”。然而，我仍然在努力用正确的条目来填充列表。我一直在搜索StackOverflow，一直认为动态设置变量名不是一个好的解决方案。然而，我想不出另一种方法来做到这一点。我创建了一个DataFrame，它是从pandas (从excel中读取)创建的，其中包含有字符串头和整数条目的列，还有一个列，其数字(让我们称之为周)1到52依次递增。我想要做的是创建单独的列表，每个列表都为列标题命名，条目是显示所列整数的次数的周数。这对于一些列来说很简单，只需手动创建列表名，但是随着列数的增加，这可能会有点失控。这是我能想到的最好的解释。希望一个简化的例子能澄清这一点。 w

浏览 7提问于2016-09-21得票数 0

2回答

从现有日期创建Pandas中的新日期时间列

python、pandas、datetime

我正在尝试在Pandas DataFrame中创建一个新的列。DataFrame包含一个名为"date“的列和YYYY格式的条目，例如2021-06-11。我试图在“日期”之后增加一个新的专栏。我可以访问个人条目。 print(str(datetime.strptime(str(df["date"].iloc[0]), '%Y-%m-%d')+timedelta(days=1))[0:10]) 2021-05-01 但我似乎不能创建一个新的专栏： df["mergeDate"]=str(datetime.strptime(str

浏览 4提问于2021-06-11得票数 1

4回答

如何根据熊猫栏填写丢失的值？

python、pandas、numpy

我有熊猫的数据 df = pandas.DataFrame({ "n": ["a", "b", "c", "a", "b", "x"], "t": [0, 0, 0, 1, 1, 1], "v": [10,20,30,40,50,60] }) 如何用缺失的值填充，使列t的每个值在n列中都有相同的条目？也就是说，每个t值都应该有a, b, c, x的条目，如果缺少这些条目，记录为NaN： n

浏览 8提问于2017-03-24得票数 3

回答已采纳

2回答

计算满足多个条件的数据文件中的条目数

python、pandas、dataframe、numpy

我有一个9列的数据，其中两列是性别和吸烟状态。dataframe中的每一行都是一个人，每一列都是它们在特定特征上的条目。我想数一数符合条件，既吸烟，是男性的条目。我试过使用求和函数： maleSmoke = sum(1 for i in data['gender'] if i is 'm' and i in data['smoker'] if i is 1 ) 但它总是返回0。但是，当我只检查一个标准时，这个方法就能工作了，但我不知道如何将它扩展到第二个标准。我还试着编写了一个函数，该函数计算了进入dataframe的每个条目的数量，但对于所有条

浏览 5提问于2022-03-03得票数 0

回答已采纳

1回答

操纵大熊猫名单一栏

python、pandas

我有一个像这样的数据文件： import pandas as pd score = [[0,1,0,3],[0,2,6,4,0,0],[0,0,0],[0,4,4,2,1,0,0,0]] group = ["A", "B", "C", "D"] df = pd.DataFrame([group, score]).T df.columns = ['Group', 'Score'] 您会注意到，得分列包含不同长度的数组。我想创建两个新列。希望第一个新列是该行的Score列中的零总数。我希望第二个新列是该

浏览 2提问于2022-09-21得票数 1

回答已采纳

2回答

多索引数据中多列准则的行选择(更有效的解决方案？)

python、pandas、row、multi-index

我有一个dataframe，它由许多“比率”列(67列: ratio_1到ratio_67)组成。基于这些列，我想在我的dataframe中创建一个新列，其中包含一个条目“pass”或“fail”。我被困在两件事上，为了解释我的df，我做了一个简单的例子： import random col3=[0,0,0,0,2,4,6,0,0,0,100,200,300,400] col4=[0,0,0,0,4,6,8,0,0,0,200,900,400, 500] listt = [np.nan, np.nan , 1, 1, 1, 5, 5, 1, 1,np.nan ,np.nan ] col5

浏览 1提问于2019-06-20得票数 2

回答已采纳

2回答

使用现有数据values中的值的新数据格式

python、pandas、dataframe、melt

exdf = pd.DataFrame({'Employee name': ['Alex','Mike'], '2014.1': [5, 2], '2014.2': [3, 4], '2014.3': [3, 6], '2014.4': [4, 3], '2015.1': [7, 5], '2015.2': [5, 4]}) exdf Employee name 2014.1 2014.2 2014.3 2014.4 2015.1

浏览 1提问于2020-05-08得票数 2

回答已采纳

1回答

从以csv分隔的制表符创建数据，其中有些列是json类型，而有些列不是

json、scala、apache-spark、apache-spark-sql

我试图从csv中创建一个(使用scala)，其中包含如下条目:这是由5列组成的单个行条目： {“用户名”：“john_doe，”id：“123411”}{“国家”：“IN”，“城市”：“BOM”} 所以，有些列是JSON格式的，而有些则不是。我确实编写了一些代码，将JSON列作为字符串处理，并将它们按行顺序直接添加到dataframe中，但剩下的其他列，我不得不手动将它们添加到dataframe中，因为我创建了一个单独的dataframe，向它添加了一个"id“列，做了一个自然的连接，每次删除"id”列，这将是一个代价高昂的过程。任何帮助都将不胜感激！

浏览 0提问于2018-01-29得票数 0

1回答

来自Pandas中的级数及其自身的布尔DataFrame

python、pandas、dataframe

我有一个Pandas DataFrame，其中的类别信息存储在一个列中，如下所示(只有2个类别，但有很多项)： | index | item | category | |-------|-----------|----------| | 0 | water | drink | | 1 | pasta | food | | 2 | burger | food | | 3 | pepsi | drink | | 4 | chocolate | food | 我想创建一个掩码DataF

浏览 20提问于2018-06-21得票数 1

回答已采纳

1回答

“扳手操作失败”创建NULL_FILTERED索引

database、google-cloud-platform、google-cloud-spanner

我无法在云扳手表上创建索引，收到“扳手操作失败”的错误。即使将集群大小从6个节点增加到16个节点，我也无法在大约1 200万行表上创建两个索引。我所做的：在3节点集群上用扳手创建objects表表有10-12列，包括STRING、INT64和一个ARRAY<STRING>。主键是两列；一个碎片值(object_id的散列)和object_id 负载~1 200万行表在加载时没有索引(主键除外)。加载固定的3节点；升级到6节点我尝试了什么：尝试构建三个索引(通过控制台中的DDL ) --收到“扳手操作失败” 扳手节数

浏览 1提问于2018-03-27得票数 5

回答已采纳

2回答

如何将任何类型的列表转换为双重类型(Scala)

scala、apache-spark、mean、databricks

我是Scala的新手，我想了解一些基本的东西。首先，我需要计算-- DataFrame的特定列的平均，并将结果作为双类型变量使用。在进行了一些互联网研究之后，我能够计算平均值，同时使用以下命令将其传递到列表类型的任意中： val avgX_List = mainDataFrame.groupBy().agg(mean("_c1")).collect().map(_(0)).toList 其中"_c1“是my dataframe的第二列。这一行代码返回一个类型为ListAny的列表。为了将结果传递给变量，我使用了以下命令： var avgX = avgX_List(

浏览 0提问于2019-04-23得票数 1

回答已采纳

1回答

如何在pandas数据框中创建自己的数据框条目列

python、pandas、dataframe

我希望将数据帧中的值转换为同一数据帧中它们自己的列，以便每个名称条目只有一行(而不是同一条目出现在不同列条目的多行中)。下面是一个例子。这是我拥有的数据框架： Name Food Grams 0 Tammy Fish 200 1 Tammy Rice 105 2 Wenny Rice 250 3 Wenny Eggs 100 4 Wenny Eggs 90 5 Steve Plums 10 6 Steve Eggs 90 (数据帧的代码如下所示) 我想将其转化为以下几点： Name

浏览 3提问于2021-01-06得票数 0

1回答

如何用2行读取数据集以返回一半的数据集

python、dataframe

我有一个包含len 299357行和7列的dataframe。我想按2计数并创建一个新的数据集守则如下： df.shape(299357, 7) dff = [] for i in range(0, len(df),2): dff.append(i) len(dff) # >>> 147920 #then i convert the list to dataframe again with dff= pd.DataFrame (dff) 但当我看到dff.shape，我又回来了，(147920, 1) 我的7列df在哪里？ df.head是这样的： a

浏览 3提问于2020-02-05得票数 0

回答已采纳

1回答

如何在2列的值匹配的DataFrame中压缩条目，同时从第三列压缩和追加特定数据

python、pandas、dataframe

我有一个包含多个列的DataFrame，这个问题的重要部分是： A:字符串中的简短描述：(A+) B:一个5个字符的标识符：(A-Za-z0-9{5}) C:包含简短描述的字符串，然后是6位ID，后面是2位数字的Sub ID：(A+=\d{6}.\d{2}) 示例： A B C 0 Some_Str AAAAA A_ID=000001.01 1 Some_Other_Str BBBBB B_ID=000002.02 2 Some_Str AAAAA

浏览 4提问于2022-02-12得票数 0

回答已采纳

1回答

熊猫Dataframe字符串列连接Int

python、pandas

为了简单起见，假设我们有一个包含字符串值的单一列的dataframe。我想要创建第二个列，它包含一个整数，表示字符串中每个字符的ASCII值。请看下面的内容。假设A列是我们拥有的，B列是我们想要的。 Column_A Column_B JJIIV 7474737386 OOEWW 7979698787 ZZXSW 9090888387 QLHMN 8176727778 WESDFG 876983687071 好的，看看A，JJIIV列中的第一个值，我们得出了B列的结果: 1)将JJIIV分解成'J'，'J'，

浏览 5提问于2016-04-12得票数 1

回答已采纳

3回答

Python Dataframe-计算列表元素的出现次数

python、pandas、dataframe、counter

我有以下数据帧： basket_new列在列表中包含从0到5的数字(每个数字和交易的金额可能不同)。我想计算每个事务中每个数字的出现次数，并将该数字保存在另一个DataFrame中，如下所示：我刚刚为Cat_0创建了一个lambda函数来测试它，不幸的是它没有工作，因为它创建了“无”条目(见图2)。这是函数： df_cat["Cat_0"] = df_train["basket_new"].map(lambda x: df_cat["Cat_0"]+1 if "0" in x else None) 你能告诉我我

浏览 0提问于2020-12-15得票数 1

2回答

创建大熊猫数据栏中列的唯一值字典

python、pandas、dictionary

我有个数据： import pandas as pd df = pd.DataFrame({ 'ID': ['ABC', 'ABC', 'ABC', 'XYZ', 'XYZ', 'XYZ'], 'value': [100, 120, 130, 200, 190, 210], 'value2': [2100, 2120, 2130, 2200, 2190, 2210], 'state': ['init','

浏览 3提问于2021-03-15得票数 2

回答已采纳

1回答

Postgres查询:查找非数字的值

sql、postgresql

我一直在使用自己的自定义导入脚本将数据从Pandas Dataframe导入到postgres DB。不幸的是，我的数据不够整洁，这导致我的每一列都被解析为文本。在某些列值不是数字的情况下，有什么方法可以获得条目吗？我的计划是删除这些记录并将列转换为数字类型。谢谢!

浏览 3提问于2017-11-09得票数 3

回答已采纳

2回答

大熊猫条件栏的选择

python-3.x、pandas、dataframe

我希望根据特定的条件从DataFrame中选择列。我知道可以用循环来完成，但是我的df非常大，所以效率是至关重要的。列选择的条件是要么只有非nan条目，要么只有nan序列，然后是非nan条目序列。下面是一个例子。考虑以下DataFrame： pd.DataFrame([[1, np.nan, 2, np.nan], [2, np.nan, 5, np.nan], [4, 8, np.nan, 1], [3, 2, np.nan, 2], [3, 2, 5, np.nan]]) 0 1 2 3 0 1 NaN 2.0 NaN 1 2 NaN 5.0 N

浏览 3提问于2016-11-06得票数 3

回答已采纳

2回答

如何检查一列中的模式条目并计算模式的数量？

python、string、pandas、dataframe、data-analysis

我有一个DataFrame： Name Price 0 Dictionary 3 1 Book 4 2 Dict En-Ru 2 3 BookforKids 6 4 Dict FR-CHN 1 我需要一段代码，它将检查列'Name‘中我可以自己指定的模式，并计算在另一个DataFrame中创建的模式的数量。例如，用patterns Dict检查'Name‘列中的条目数量，忽略大小写的Book会得到以下结果： | Patte

浏览 23提问于2020-04-13得票数 0

回答已采纳

1回答

将整个字典存储在Pandas DataFrame的一个元素/单元中？

python-3.x、pandas、dataframe、dictionary

可以在一个熊猫DataFrame的一个元素中存储一个复杂的字典吗？然后用类似的结构化字典填满整个专栏，好吗？我的迷你示例 import pandas as pd import numpy as np #create an example dict dict={} dict['key1']=np.array([[1, 2, 3], [4, 5, 6]]) dict['key2']=np.array([2]) dict['key3']='Mexico' #create the pd D

浏览 42提问于2021-07-03得票数 0

回答已采纳

3回答

计算整个DataFrame中的值数

python、python-3.x、pandas

我目前的DataFrame有50列和大约50000行。我正在尝试找出一个值(例如2)在整个DataFrame中出现的总次数。 DataFrame只包含0到7之间的值。我可以使用下面的代码执行单个列的代码： print(df['col1'].value_counts()) 然后，我尝试创建如下所示的for循环： for cols in df: print(df[cols].value_counts()) 这是可行的，但它会将其作为每列的单独结果打印出来。我不是按列划分结果，而是尝试获得如下所示的结果，但将DataFrame中的所有列组合在一起，而不仅仅是一列。 val

浏览 31提问于2019-01-25得票数 3

回答已采纳