从csv列中搜索字符串，并打印字符串值的value_counts_将csv列连接到字符串并打印特定值_从列中查找子字符串并写入新列(多列搜索) - 腾讯云开发者社区

、、、

我有200多个专栏的数据。我希望在每一列中都使用value_counts()。下面是我的代码，它运行良好，但当我想创建"csv“时。下面的代码只输入最后一列(值计数)。我想要所有。 import pandas as pd df = pd.read_csv("hcp.csv") for col in df: df2 = df[col].value_counts() print(df2) df2.to_csv("new_hcp.csv") 打印(Df2)显示的是所有的值计数，而不是"CSV“。任何能帮忙的人，我都会感激的。

浏览 5提问于2022-09-01得票数 1

回答已采纳

5回答

我这里有一个代码，我想在一个特定的csv文件中找到女性和男性的总数。

、、

import pandas as pd df = pd.read_csv('admission_data.csv') df.head() female = 0 male = 0 for row in df: if df['gender']).any()=='female': female = female+1 else: male = male+1 打印(女性)打印男性 CSV文件有5列我想知道女性的总人数，男性和她们的人数，女性被接纳的人数，男性被接纳的人数。谢谢。这是我尝

浏览 1提问于2018-01-26得票数 1

回答已采纳

1回答

Python -遍历CSV文件中的特定列

、

我目前在python上显示了我的csv文件： df = pd.read_csv("Desktop\Assignment\World Cup 2018.csv") df.head() 在这里，我可以看到我的数据已被打开，不需要的列已被删除。现在，我想使用一些名为CounterVal1 (依此类推)的变量来计算队形在一行中出现的次数。 for i in enumerate(df['home_formation']): if i == '4-2-3-1': counterVal1 += 1 elif i == '4-1-4-1'

浏览 6提问于2018-12-17得票数 0

1回答

查找列计数的非结构化数据

、、、

我有来自perf日志的非结构化数据。我想从中获取服务的详细信息。我可以做分隔符，但我不能计数或打印列，因为它没有任何标题。请帮我弄清楚这个问题。 import pandas as pd df = pd.read_csv (r'/Users/Myhome/Documents/Py_Learning/log.csv', sep = '|' , skipinitialspace=True) #df = pd.read_csv (r'/Users/Myhome/Documents/Py_Learning/log.csv', sep =':|

浏览 18提问于2019-12-15得票数 0

回答已采纳

2回答

熊猫:一列中每一个值出现在另一列中的次数

、

我希望计数子列中值出现在父列中的次数，然后在新列重命名子计数中显示此计数。见下面的预览df。我已经通过VBA (COUNTIFS)完成了这一工作，但是现在需要动态可视化和动画显示，使用从dir输入的数据。因此，我求助于Python和Pandas，在搜索和阅读了答案之后，尝试了下面的代码，比如： \\、、\\、\{e76f}许多其他的.但仍然不能得到预期的预览，如下图所示。任何帮助都将不胜感激。提前谢谢。 #import libraries import pandas as pd import numpy as np import os #get datasets path_dataset

浏览 4提问于2020-06-19得票数 0

回答已采纳

1回答

在Google中使用Pandas从多个数据集中向excel文件添加新列

、、、、

我试图在一些数据之后将一些列添加到excel文件中，但是我没有得到好的结果，只是覆盖了我所拥有的。让我给您提供一些上下文:我正在读取一个，对于我使用的每个列，使用一个for到value_counts，然后在这里从这个value_counts创建一个框架--只为一个列编写代码： import pandas as pd data= pd.read_csv('responses.csv') datatoexcel = data['Music'].value_counts().to_frame() datatoexcel.to_excel('savedat

浏览 2提问于2022-08-01得票数 0

回答已采纳

1回答

基于最频繁值的子集

、、

假设我有以下数据集作为CSV文件。我希望我的输出是一个CSV文件，它是此数据的子集，仅基于与列B中最频繁的值相关联的数据。在下面的示例数据中，列B中最频繁的值是"1"，但是这将会改变，因此我需要我的代码不是那么具体。 A B ! 1 @ 1 # 1 $ 1 % 2 ^ 3 & 2 * 4 ( 5 ) 2 In this example, I want my output to be a CSV file of: A B ! 1 @ 1 # 1 $ 1 但是由于最频

浏览 7提问于2019-03-09得票数 2

回答已采纳

2回答

如何使用pandas一次计算多列中的值

、、、、

我了解到，当我输入df = pd.read_csv("file.csv")时，我可以从csv文件中获取以下数据： round date first second third fourth fifth sixth bonus 0 959 2021.04.17 1 14 15 24 40 41 35 1 958 2021.04.10 2 9 10 16 35 37 1 2 957 2

浏览 32提问于2021-10-12得票数 0

1回答

打印在python中最多出现的数据的名称和计数

、、

我需要打印一个在csv文件中列中出现次数最多的赛道的名称。我试过这样做： popular_course = (race_data.groupby(race_data.Race_Course.tolist(),as_index=False).size()) print(popular_course) 我的产出是： Aintree 3 Ayr 6 Fairyhouse 3 Punchestown 3 Sandown 3 dtype: int64 当我将打印函数更改为： print(popular_course.max()) 我明白了

浏览 1提问于2019-04-21得票数 0

回答已采纳

2回答

在写入CSV时操作Pandas输出

、、、

我正在试着写一些能做以下事情的东西：读取超过1m行、100列数据的CSV；按照从最大行到最少行的顺序列出重复行的出现情况来总结每列到目前为止，我所拥有的： import pandas as pd df = pd.read_csv (r'infile.csv') outfile = ('outfile.csv') for i in df: df.pivot_table(index=i, aggfunc='size').to_csv(outfile, mode='a') 下面的代码输出如下： ColumnA,0 as

浏览 31提问于2020-08-24得票数 0

回答已采纳

1回答

Excel公式的Python版本

、

我目前正在创建一个Python3程序，该程序将从六列CSV中挑选出最频繁的数字。到目前为止，我已经有了从每一列中挑选最频繁的代码，但我也希望代码能够从所有列和行的组合中挑选六个最频繁的数字(从第一个最频繁的数字到第六个)。我有一个Excel电子表格可以做到这一点，使用公式： =MODE(IF(1 - ISNUMBER(MATCH(B2:G402,$L$24:L24,0)),B2:G402)) 然后向下拖动计算，显示六个数字(据我所知，这是一个有效的公式！) 有没有办法在Python3中得到这个公式，或者更好的东西？那么，代码将显示6列和400+行中最常见的前6个数字？到目前为止，我的代码如

浏览 3提问于2019-08-11得票数 0

回答已采纳

2回答

Pandas value_count()‘索引必须是单调的’，但索引已经是单调的

、、、

当尝试获取数据框中某些列的值计数值时，我收到此错误，指出索引必须是单调的，但is_monotonic属性表明索引已经是单调的。导入csv后，dataframe中的大多数列都不会返回此错误，但也有少数列会返回此错误。我已经尝试了中提到的一些策略，但似乎不能让它工作。执行此操作： import pandas as pd data = pd.read_csv('info/train.csv') print('Monotonic?: ', data['net_booking_value_monthly'].index.is_monotonic) pr

浏览 28提问于2017-12-13得票数 0

1回答

领导或尾随空格和熊猫value_counts与布尔选择

、

我正在使用从我所在的郡警长部门下载的csv文件创建的数据文件。数据位于，可以使用read_csv()读取。“数据”载有向治安官报告和采取行动的事件的信息。其中一列是事件发生的城市，我试图创建一个表和图表，显示我所在地区(Larkfield)的事件数量随时间的变化。当我使用熊猫的value_counts函数以“城市”作为输入时，我得到 In [86]: compcounts = soco['city'].value_counts() In [96]: compcounts[0:10] Out[96]: SANTA ROSA 55291 WINDSOR

浏览 5提问于2015-08-16得票数 1

回答已采纳

2回答

对dataframe中某列中某列的每个值进行计数

、、、

我正在努力做下面的事情，不知道你能不能帮我。我有一个2列的熊猫数据框架。我想计算A列中A列的每个值。如果出现的次数大于1，则打印(‘hello’) 例如, for i in range(1, len(DF)) **if count(DF.iloc[[i],[1]].values)>1:** print('hello')有什么可以帮忙的吗？谢谢，H

浏览 1提问于2020-01-16得票数 1

1回答

django中的dataframe对象与字符串值的比较

、、

我正在实现机器学习模型，并使用来自MySQL表的训练数据集，所有这些都建立在Django之上。因此，基本上所有的计算都是通过将整个数据从MySQL表转换到dataframe来完成的。 df = pd.read_sql("select * from naivebayes_player",connection) 但是，在将dataframe列值与字符串进行比较时，我遇到了一些问题。因此，我在MySQL表中有一个名为分类的列，其中有2个固定值'RS‘或'NRS’，以varchar(10)格式存储。由于我已经将整个表转换为dataframe，所以每当我在datafra

浏览 0提问于2018-01-13得票数 0

2回答

如何在python中获取csv列中出现次数的计数并另存为包含该计数的新csv

、、、

我是python的新手，我会非常感谢你的帮助。我试了一整天。我有一个包含10列的csv文件。我只对3个州，县和邮政编码感兴趣。我正在尝试，尝试并尝试获得每个列(例如CA 20000，TX 14000 )中出现的次数的计数，并将计数结果输出保存在csv文件中，该文件可以轻松地导入到excel中，并进一步与地理空间文件合并。我设法选择了我需要的3列 import numpy as np from tabulate import tabulate import pandas as pd #Replace with path and name file in your computer f

浏览 0提问于2020-04-30得票数 2

2回答

给没有名称的dataframe列指定名称

我把一个pd.series转换成一个数据格式。转换后，一个dataframe列没有任何名称，另一个列的名称为"0“。我需要给列起名字。我试过使用df.columns = "A“、"B”和重命名，但是没有用 import pandas as pd import nltk from nltk.corpus import stopwords #for removing stopwords import re #for removing numbers, special characters #Impor

浏览 0提问于2019-07-10得票数 1

回答已采纳

2回答

如何使用csv模块在csv列中搜索特定单词

、、

我有一个csv文件，我只想在其中搜索一列的文本。例如：如果我在“敏捷的棕色狐狸跳过懒狗”一栏中有一行文本，并且我在“文本”列中搜索“狗”，我应该打印该行。到目前为止，我一直在努力改进以下内容。 def read(option, searchitem): if option == "text": csvfile=open('myfile.csv','r') for row in csvfile: if row[2].find(searchitem):

浏览 30提问于2020-01-23得票数 0

回答已采纳

2回答

使用awk从csv文件返回相邻匹配值。

、

我试图从csv文件中搜索一个字符串，如果找到匹配项，则返回相应的$N列值，否则返回N/A。假设我的csv文件名为Book1.csv，内容如下， a, this, that, those b, something, many thing, anything c, duck, goose d, rock, paper, scissor 我的目标是搜索，比如c，并打印相应的列，比如第二列的值。在这种情况下，输出将是duck 我尝试使用这个命令awk -F "c\"*,\"*" '{print $2}' /home/linuxmint/Desktop/t

浏览 7提问于2021-04-20得票数 0

回答已采纳

2回答

在多个列中搜索最常用的值

请原谅这个问题的基本性质，但我已经寻找了几个小时的答案，它们似乎都让我需要的东西变得过于复杂。我有一个数据帧，如下所示： id food_item_1 food_item_2 food_item_3 1 nuts bread coffee 2 potatoes coffee cake 3 fish beer coffee 4 bread coffee coffee 我想要做的是搜索所有的'food_item_*‘列(所以在本例中有3个

浏览 13提问于2020-02-18得票数 1

回答已采纳

1回答

如何用Pandas绘制csv文件的字符串直方图和浮点值

、、、

我需要显示csv文件的特定属性的直方图。当我绘制数字值时，我没有问题，但是当我使用string值时，程序会崩溃。现在我使用虹膜数据集进行测试，当我选择“物种”列时，程序会崩溃。错误是： Traceback (most recent call last): File "C:\Users\Enrico\PycharmProjects\PythonDataset\Plot_hist.py", line 31, in <lambda> self.pushButton.clicked.connect(lambda: self.plotHistogram(fileN

浏览 0提问于2018-11-06得票数 0

回答已采纳

1回答

更改列标题CSV文件

、、

我当前正在尝试更改我正在创建的文件的标题。我使用的代码如下； import pandas as pd import os, sys import glob path = "C:\\Users\\cam19\\Desktop\\Test1\\*.csv" list_=[] for fname in glob.glob(path): df = pd.read_csv(fname, dtype=None, low_memory=False) output = (df['logid'].value_counts()) list_.append(o

浏览 0提问于2017-08-06得票数 0

回答已采纳

2回答

熊猫-如何获取列中每个值的出现次数

、、

我有一个名为国际足联的csv文件，这是一个足球运动员的统计记录。有一个列，叫做‘首选脚’(用来踢球)，它的值可以是‘左’或‘右’脚，只有每个记录(球员)。那么，怎样才能最快地计算出拥有右脚和左脚的玩家的数量。示例表： # Foot 1 Right 2 Left 3 Left 4 Right 5 Right 6 Left 7 Right 8 Right 从这个表中，我需要列中每个可能的值的参与者数，因此，反过来，上面的表将用于创建这个表。 Foot Number Right 5 Left 3 请使此通用化，就像我要向列的可能值添加除左或右以外的多个值一样。不要将其限制为列的

浏览 3提问于2020-08-30得票数 0

回答已采纳

1回答

如何从两个.CSV文件中只对前3个位置进行排序和存储，然后使用.CSV将它们存储在一个.CSV文件中的两个列中？

、、

对平均2016.csv和平均2017.csv文件中的数据进行排序。只存储来自每个文件的前3个位置。前三个位置数据将存储在一个文件中，命名为top3.csv。头3.csv文件中的每一列都将存储每年的结果。因此，top3.csv文件将包含2016和2017列。这是平均2016.csv文件的一小部分这是平均2017.csv文件的一小部分我在Pandas中使用Python3.8 我不知道该怎么做。我需要对这些文件中的数据进行排序。我只需要存储来自每个.CSV文件的前3个位置。前3位将是平均.CSV文件中的前3位。然后，我必须将每个平均文件中的前3位平均值存储到一个文件中，top3.csv

浏览 2提问于2020-04-10得票数 0

回答已采纳

3回答

排除逗号的dataframe列值的唯一计数？

、

假设我的数据是这样的： + + Index | A | B +--------------|---------|----------+ | | 1 |Y,Z | nan | | 2 |Y,Z,X | 2 | | 3 |Z | 7

浏览 9提问于2022-07-19得票数 1

1回答

如何根据条件在dataframe中选择行

、

我有一封电子邮件数据，我在其中给出了这个查询： williams = emails[emails["employee"] == "kean-s"] 这将选择具有employee kean-s的所有行。然后我数数频率和打印最上面。这是怎么做到的： williams["X-Folder"].value_counts()[:10] 这提供了这样的输出： attachments 2026 california 682 heat wave

浏览 0提问于2019-09-25得票数 0

回答已采纳

2回答

如何将value_count输出分配给数据

、

我试图将value_count的输出分配给一个新的df。我的代码如下。 import pandas as pd import glob df = pd.concat((pd.read_csv(f, names=['date','bill_id','sponsor_id']) for f in glob.glob('/home/jayaramdas/anaconda3/df/s11?_s_b'))) column_list = ['date', 'bill_id'] df = df.set_

浏览 1提问于2016-03-09得票数 8

回答已采纳

1回答

搜索CSV文件，如果不在文件中

、、、

我有一个CSV文件，里面装满了票证信息。我创建了一个小脚本，将票证编号以空格分隔到一个列表中，该列表在CSV文件中搜索列表中的每个票证，如果它找到了票证，就会在该行上输出信息。我的问题是，如果我搜索的票证不是在CSV文件，它只是跳过它并继续前进，但我希望它告诉我，票不在文件中。据我所知，它是逐行搜索CSV文件。如果我尝试一个else语句，它将开始打印CSV文件中的每一行，如果该票证不在行中。我需要能够输入多个票号，并让python搜索每个单独的。如果它在第1列中找到了票证，然后从该行中打印信息，如果它在任何行第1列中找不到票证，则打印出该票证后面的“不在文件中”。 import csv

浏览 0提问于2018-05-04得票数 1

回答已采纳

2回答

1000个整数GroupBy -出现

、、、

我在1到100之间创建了100万个随机整数&将结果写入一个文本文件。 Results_File = open('RandomResults.txt','w') for i in range(1000000): x = random.randint(1,100) Results_File.write(str(x) + "," + '\n') 好的，那就行了。但我希望在整个数据集中找到每个整数的出现情况。因此，我将文件导入到一个新的python会话中，并从数据中创建了一个dataframe。(我还打开了csv

浏览 1提问于2018-10-09得票数 1

回答已采纳

1回答

如何命名pandas的CSV输出中的列？

、、

我在编写包含两列的csv文件时遇到了一些问题。第一列包含间隔或存储箱，而第二列包含这些存储箱中的事物计数。我从另一个包含原始数据点的csv文件制作了这个csv文件。我可以写这个文件，但是我不能命名这些列。我预计输出文件应该是一个包含两列的csv，所以我向.to_csv函数提供了一个包含两个名称的列表，结果出现了以下错误 Traceback (most recent call last): File "C:/Users/willi/Documents/Python/csv_processing_scratch/simple_csv_processor.py", li

浏览 44提问于2020-01-18得票数 0

1回答

在csv中搜索行/列不起作用(python)

、

import csv import time, collections, sys, openpyxl, xlrd from openpyxl import Workbook from openpyxl import load_workbook from datetime import datetime ## Read the CSV file ## scanReport = open('scan_report2.csv', 'r') scanReader = csv.reader(scanReport) desired_row = "Severit

浏览 4提问于2017-03-10得票数 0

3回答

如何在熊猫图中将数字数据更改为文本？

、、

我有两个条形图是从csv列画出来的。列名为“性别”，男性为0，女性为1。这是我的密码： df = pd.read_csv("file.csv") df['sex'].value_counts().plot(kind='bar') plt.show() 我不想每个酒吧有0和1，我想把它分别改为“男性”和“女性”。我得到的输出是：

浏览 3提问于2020-05-05得票数 0

回答已采纳

3回答

我如何才能从熊猫的csv中得到最常见的两个日期之间的前10个值？

、、

本质上，我有一个csv文件，它有一个OFFENCE_CODE列和一个日期为OFFENCE_MONTH的列。我提供的代码检索了OFFENCE_CODE列中最常见的10个违规代码，但是我需要能够在两个日期之间从OFFENCE_MONTH列中检索这些代码。 import numpy as np import pandas as pd input_date1 = 2012/11/1 input_date2 = 2013/11/1 df = pd.read_csv("penalty_data_set.csv", dtype='unicode', usecols=[&

浏览 3提问于2022-10-01得票数 0

回答已采纳

2回答

使用pandas数据框为多列绘制图形

、、、

我有一个名为"file.csv“的csv文件。 ,DATE,DAY,OPEN,2PM,CLOSE,STATUS 0,2021-05-18,Tuesday,538.8,530.45,530.8,0 1,2021-05-19,Wednesday,530.65,532.6,536.85,0 2,2021-05-20,Thursday,536.95,537.05,536.35,1 3,2021-05-21,Friday,538.0,538.2,537.55,1 4,2021-05-24,Monday,537.3,535.05,532.85,1 5,2021-05-25,Tuesday,535

浏览 4提问于2021-07-06得票数 2

2回答

比较3个csv文件与Python Pandas

、、、

我需要比较3个csv文件来比较3列(所有3列在所有3个csv文件上都有相同的名称)，计数1)什么是重复的，2)什么是不同的(只有计数是好的)。例如。csv1 colB需要检查并与csv2 colB和csv3 colb比较重复的计数总计(在CSv2，3上匹配)和coutn总计(在CSv2/3上匹配)。所有3个csv都有相同的列名，colB有ip地址，colC有散列值，colD有域名。我在matching colB with failure上尝试了这个测试： print(df[~df.colB.isin(df1.colB)]) #prints out all columns from df

浏览 23提问于2021-03-30得票数 1

回答已采纳

1回答

在一个数据索引的最左边的数字中，0-9重复的频率是多少次？

、、、、

我在想，我们是否可以计算出某些熊猫数据的最左边的index中有多少次0-9重复： A B C 0 -56.343656 NaN -418.540483 10 -87.577880 -16.061497 NaN 20 NaN -15.337254 NaN 40 -67.462841 NaN -431.924830 50 -63.377158 -28.260790 NaN 60 NaN -22.996095

浏览 0提问于2019-01-17得票数 0

1回答

使用python pandas转换事件字典中的二进制数据集合

、、、

我有一些CSV格式的数据，如下所示： Time [s],Data 0.000916000000000,0b 1111 1110 0100 0100 0000 1111 0011 1100 0.024800000000000,0b 1111 1110 0100 0100 0000 1111 0011 1100 0.048684000000000,0b 1111 1110 0100 0100 0000 1111 0011 1100 ... 4.729276000000000,0b 1111 1110 0100 1000 0000 1111

浏览 0提问于2016-02-14得票数 0

1回答

如何在python中比较两个不同.csv文件中的列？

、、

import pandas as pd A=pd.read_csv("C:/Users/amulya/Desktop/graves lab/main_now.csv", index_col=False, header=None) DATA1=pd.DataFrame(A) DATA1[0] B=pd.read_csv("C:/Users/amulya/Desktop/graves lab/words.csv", index_col=False, header=None) DATA2=pd.DataFrame(B) DATA2[0] for xrow in ra

浏览 0提问于2018-04-06得票数 1

1回答

dataframe列中的不同字符串计数

、、

我有一个.tsv数据文件。我想在某一列中打印字符串的计数。列如下所示： column1 A aaa A, C c C D E ee,F A aaa, B, C cc F E ee 我想要不同的A，B，C，A aaa等等，但是在列中，有时在"，“之后有空格。所以我的代码计算"B“和”B“的方式不同。这是我目前使用的代码： import pandas as pd import os # Import data from file into Pandas DataFrame data= pd.read_csv("data.tsv", encoding='ut

浏览 4提问于2020-11-25得票数 1

回答已采纳

3回答

搜索多个字符串的列，但显示错误Python Pandas

、

我正在数据框中的列中搜索已转换为列表的CSV中包含的值列表。搜索这些值不是这里的问题。 import pandas as pd df = pd.read_csv('output2.csv') hos = pd.read_csv('houses.csv') parcelid_lst = hos['Parcel ID'].tolist() result = df.loc[df['PARID'].isin(parcelid_lst)] result 我想要做的是，一旦搜索完列表，数据框中显示了“已找到”的值，我还想打印或显示列表中“

浏览 5提问于2018-12-09得票数 1

1回答

如何在Python中测试csv文件的特定列中的条件

、、、

我已经知道了如何遍历具有n列的csv文件中的特定列。但现在我想要创建一个条件，但我不确定如何创建。所讨论的列是一周中的某几天(星期一、星期二等)。我想写代码，以便我的迭代计算所有的星期一，所有的星期二，等等。这是我写的，我得到了一个语法错误。 mon = 0 # print (df) days_week = df.iloc[4:,2] # print(days_week) for i in days_week: if i == "MONDAY" mon+=1 当前此特定列的数据类型为“object”。所以我想我需要把它改成字符串？

浏览 15提问于2020-06-29得票数 0

回答已采纳

1回答

为每个id分别绘制子图

、、、、

我试图从我的csv中提取基于'id‘列的最大10个值的信息，并将它们放在一个子图中(每个id的每个子图)。 #data : contains original csv #data_big : contains refined data data_big = data_big.nlargest(10, 'a') #searched first 10 largest entries from 'a' fig, ax = plt.subplots(nrows=5, ncols=2, figsize=(12, 16)) fig.subplots_adjus

浏览 4提问于2022-10-19得票数 0

回答已采纳

2回答

为什么dataset的一列中的value_counts会添加除一个特定类别(DDoS)之外的所有内容？

、

我有一个使用三个csv的数据集，我需要知道一个特定列(标签)中的唯一值及其数量，以便稍后绘制。在DDoS之前，它工作得很好。我已经检查了原始数据，一切正常。我该如何解决这个问题？ dataset['Label'].value_counts() 探头98129 DDoS 73529 正常68424 DoS 53616 DDoS 48413 BFA 1405 网络攻击192 僵尸网络164 U2R 17 名称:标签，数据类型: int64

浏览 19提问于2021-09-16得票数 0

2回答

Python:使用CSV文件中的列值创建饼图

、

我试图用CSV文件中的列值创建一个饼图，但我似乎没有按照正确的方法进行。我正在使用一个CSV文件(student_grades.csv)，我想用csv文件中'Result‘列的数据创建一个饼图。该列中带有“1”的行表示“通过”，而该列中带有“0s”的行表示“不及格”。我正在尝试为通过和失败的结果创建一个饼图。以下是我到目前为止所做的工作，我将非常感谢并请给予建议。 import matplotlib.pyplot as plt import pandas as pd doc = pd.read_csv('student_grades.csv') pass_fail

浏览 53提问于2019-09-16得票数 0

1回答

熊猫-将一列转换为字符串列表后对覆盖元素进行计数

、、

我有一个CSV文件，并使用df = pd.read_csv('my.csv')读入熊猫df = pd.read_csv('my.csv')。我的数据如下所示： choice userid A\nB\nC 111111 A\nC 222222 B 333333 通过这个DataFrame，我想通过两个步骤来实现我的目标： (1)将选择列中的值拆分为'\n‘ (2)计算我的CSV文件中有多少As，Bs和Cs。我试过了：target = df['choice'].str.split('\n

浏览 2提问于2017-09-28得票数 1

回答已采纳

3回答

用于在哈希值中搜索特定字符串的Python程序《编码帮助》

、、、、

尝试编写一段代码，用于搜索特定字符串(由用户输入)的散列值，如果该行中存在searchquery，则返回散列值。这样做只是为了多学一点python，但它可能是HR部门使用的真实应用程序，用于在.csv简历数据库中搜索每个简历中的特定单词。我想让这个程序浏览一个每行有三个条目(id#;applicant名称；简历文本)的.csv文件。我将其设置为创建一个散列，然后为简历文本散列条目创建一个字符串，并尝试使用.find()函数返回每个实例的整个散列。我想要的是，如果单词"gpa“被用作搜索查询，并且在”简历文本“中找到了三个申请者( .csv文件中的行)，那么它将打印包含它的每一行

浏览 1提问于2010-05-13得票数 1

回答已采纳

1回答

如何在csv中搜索特定文件。数据库excel

、、

我正在创建一个地址簿程序，我遇到了一个问题，即使用户按姓氏进行搜索。他们可以输入一个名字，但仍然可以打印联系信息。如何将csv搜索限制为只搜索一列。我的代码： if choice == 'surname': print() surname = input('Input surname: ') print() with open('AddressBook.csv', newline='') as myfile: reader = csv.reader(myfile)

浏览 1提问于2014-04-28得票数 0

2回答

Python，熊猫最常从csv打印1-1000

、、、

我有以下代码： import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import csv data1=pd.read_csv('11-01 412-605.csv', low_memory=False) d412=pd.DataFrame(data1, columns=['size', 'price', 'date']) new_df = pd.value_counts(d412['size']).reset_index(

浏览 3提问于2019-11-02得票数 0

回答已采纳

4回答

Linux搜索Zeroes列2

、、

我一直在尝试不同的组合，使用grep和find首先打印文件名，然后在这两列的第二列风速.csv文件的第二列=="0.0“时，打印实例或整行。我需要从工作目录中递归地搜索。我已经用grep尝试过这些解决方案，并在下面找到了，但是当我知道在工作目录和子目录中的一些.csv文件中存在这样的实例时，它不会返回任何内容。非常感谢--我花了一些时间，我知道这很容易。 grep -Rx --include "*SPD-daily.csv" 0.0 . find . -name "*SPD-daily.csv" | xargs grep -i "0.0"

浏览 10提问于2017-02-27得票数 1

回答已采纳

3回答

如何从熊猫数据中统计列表中的特定单词？

、

我想知道如何从特定的数据框架中计算出列表中的唯一单词的数量。例如，假设我接下来有一个list = ['John','Bob,'Hannah']，我有一个数据框架，其中有一个名为句子的列 df = ['sentences'] 0 Bob went to the shop 1 John visited Hannah 2 Hannah ate a burger 我想要的输出是： John 1 Bob 1 Hannah 2 如何计算数据集中任意行中任何给定句子中的唯一名称？

浏览 3提问于2021-06-26得票数 1

回答已采纳