在具有指定位置的整数的列中添加逗号(Pandas)_在逗号分隔的其他列中添加该列的位置的列_python - 选择在指定位置具有最高整数值的子列表？ - 腾讯云开发者社区

python、pandas、dataframe、indexing

我有一个包含键-值对的pandas Series，其中键是我的pandas DataFrame中列的名称，值是DataFrame中该列的索引。例如：系列：然后在我的DataFrame中：因此，从我的DataFrame中，我希望从'A‘的DataFrame中提取索引12处的值，即435.81。我想将所有这些值放入另一个序列中，所以类似于{ 'A'：435.81，'AAP'：468.97，...} 我的声誉很低，所以我不能将我的图片作为图片发布，而不是链接(有人能帮我解决这个问题吗？谢谢！)

浏览 30提问于2017-08-15得票数 0

2回答

将pandas数据框值转换为标量

python、pandas、dataframe、scalar

如何将1行1列的pandas数据框转换为标量值？ import pandas as pd data = {'col1': 1} df = pd.DataFrame(data=d)

浏览 0提问于2017-12-21得票数 4

1回答

在Pandas中将一行追加到现有的CSV文件中会得到NaN值

python、pandas、csv

我正在尝试向现有的CSV文件中添加一行。这是存储在CSV文件中的数据的快照。 ? 我从另一个DF中提取了最后一行，并将其附加到现有的CSV文件中。这是我试图添加到CSV文件中的数据。 ? 现在，当我尝试将行添加到文件中时，它以一种奇怪的方式添加。我尝试添加的代码的快照。 temp.to_csv('MarutiSEPFut.csv', mode='a', header=False) 执行以上行后，CSV文件的输出为： ? 因此，基本上这显然不是期望的输出，因为所有的值都已分配给第一列，其余的列值已分配为NaN。下面是我将full_dat

浏览 3提问于2019-09-18得票数 1

回答已采纳

3回答

pandas在列中使用额外的逗号读取csv

python、csv、pandas

我正在读取一个基本的csv文件，其中的列用逗号分隔，并使用以下列名： userid, username, body 但是，body列是一个可以包含逗号的字符串。显然，这会导致一个问题，pandas会抛出一个错误： CParserError: Error tokenizing data. C error: Expected 3 fields in line 3, saw 8 有没有办法告诉熊猫忽略特定列中的逗号，或者绕过这个问题？

浏览 2提问于2015-09-23得票数 25

回答已采纳

1回答

使用Pandas -Exception导入数据表:索引(列0)具有重复值[nan]

io、pandas

我是pandas的新手，所以如果我忽略了一些显而易见的事情，请原谅我，但我似乎在前面的问题中找不到答案。我试图将一个表导入到Pandas中，该表有任意数量的空格作为分隔符。下面是数据的一个示例： *PRODUCT : Backscatter Ratio - 1064.0 nm ^ Altitude 2010/03/23 17:01:00 2010/03/23 17:03:00 ... 1.50 1 1

浏览 6提问于2012-06-12得票数 1

2回答

如何删除字符串注释并保留值？

python-3.x、jupyter-notebook

import pandas import numpy as np cols = ['DATA'] val = pandas.read_excel('ACC_HAMMER.xlsx' , names = cols) val.values main = np.array(val) print(main) 我得到的输出如下： [['0.00000000E+000,3.82345878E-002,1.80000000E+002'] ['1.25000000E+000,1.90616930E-001,-6.71922991E+001'] [

浏览 6提问于2017-09-29得票数 1

回答已采纳

3回答

PySpark:如何将逗号指定为十进制

csv、pyspark、number-formatting

我正在使用PySpark并加载一个csv文件。我有一个带有欧洲格式数字的列，这意味着逗号代替了点，反之亦然。例如:我使用2.416,67而不是2,416.67。 My data in .csv file looks like this - ID; Revenue 21; 2.645,45 23; 31.147,05 . . 55; 1.009,11 在熊猫中，通过在decimal=','和thousands='.'选项中指定pd.read_csv()来读取欧洲格式，可以轻松地读取这样的文件。 Pandas代码： import pa

浏览 0提问于2018-10-08得票数 13

回答已采纳

2回答

Python Pandas.to_csv无法将带有分号(；)的列导出为一列

python、pandas、export-to-csv

我有一个包含3列的dataframe，但其中1列包含导出过程中用分号(；)分隔的数据。我正在尝试将数据帧导出到csv中，但在excel中打开时，我的csv输出数据一直被分成以下格式： import pandas as pd my_dict = { 'name' : ["a", "b"], 'age' : [20,27], 'tag': ["Login Location;Visit Location;Appointment Location"

浏览 1提问于2021-07-07得票数 0

1回答

当我用熊猫阅读.csv中的特定专栏时，奇怪的一跳

python、excel、python-2.7、csv、pandas

1.背景我上传的.csv文件是一个示例文件，供我解释我的问题。此文件包含中国所有城市在某一天的所有空气质量信息(在代码中表示)。例如，列1001A表示一个城市，该列中的值表示对应于type柱的空气污染物浓度。 1.我的问题如果我想在20160205-00:00得到1014A市的1014A值，我只需要用 df = pd.read_csv("./this file") aqi = df["1014A"].iloc[0] 结果是42。但是在LibraOffice中查看相同的文件，结果如下所示：似乎潘达斯读了1013A并犯了这个错误。因此，

浏览 3提问于2016-05-26得票数 3

1回答

列的和: Pandas .sum()返回0.0

python、pandas、dataframe、csv、sum

我正在尝试使用.sum()和pandas对数据帧中的列的值进行求和。但是，对于数据类型为“float64 64”的所有列，pandas将返回“0.00”。对于设置为整数的列，它似乎工作得很好。这是我到目前为止尝试过的： df = pd.read_csv(csv_file, delimiter=';') df = df.apply(pd.to_numeric, errors='coerce').fillna(0) *#I want to convert values to numeric* print(df['UE'].dtype) *#I p

浏览 6提问于2021-03-17得票数 0

1回答

如何在更改类型(pandas dataframe)时处理“int()的基数为10的无效文本”？

python、pandas、types

我在Pandas DataFrame中有这样的专栏： data = pd.DataFrame({"consume":["11", "14", "11,5", "12,6"]}) 我想改变这个系列的类型。目前，它的类型是object，但我需要它是float64或int64。如何更改列的类型？我应该在int64还是float64上更改它当我尝试这样做的时候： data['consume'] = data['consume'].astype('int64') 我得到一个

浏览 8提问于2019-12-26得票数 2

回答已采纳

2回答

熊猫的整数切片不同的行和列？

python、pandas

来自R，我试着让我的头为熊猫数据切片整数。令我困惑的是，使用相同的整数/切片表达式对行和列进行不同的切片行为。 import pandas as pd x = pd.DataFrame({'a': range(0,6), 'b': range(7,13), 'c': range(14, 20)}) x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2? a b 0 0 7 1 1 8 2 2 9 我

浏览 2提问于2015-12-28得票数 3

回答已采纳

2回答

保留数据帧中的特定列

python、pandas

我有一个来自使用pandas的导入csv的数据帧。这个数据帧有160个变量，我只想保留5，9，10，46，89。我试试这个： dataf2 = dataf[[5] + [9] + [10] + [46] + [89]] 但我认为这个错误： KeyError: '[ 5 9 10 46 89] not in index'

浏览 26提问于2018-01-02得票数 3

2回答

当我将我的cvs导入python时，它只显示我的大小为1。

python、pandas

我的代码是： import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset= pd.read_csv('libro1.csv') 在我的excel中，我有60行14列但是它显示了一个大小为(59,1)的Dataframe

浏览 2提问于2021-06-18得票数 0

2回答

导入csv后移动的列

python、pandas、dataframe

我是Python/Pandas的新手。我想知道是否有一个代码可以帮助我解决我们从系统中拉出的.csv中的列是如何向右移动的--一列充满了用户输入(包含乱七八糟的字符“)，所以通常在加载用户输入后，列会扩展到多列而不是一列，其他列也会错误地向右移动。我在excel中手动修复了这个问题，手动过滤、删除、将列移动到正确的位置--每天需要20分钟。 ? 我想请教，如果有代码，我可以尝试清理和安排正确的列，或如果它是更容易的手动修复在excel，因为我现在做它。谢谢!

浏览 14提问于2019-06-07得票数 0

2回答

从CSV文件读取列似乎不起作用

python、pandas、csv、jupyter-notebook、lda

我有一个新闻文章的.csv数据集，其中应该有出版物、日期、标题等列。当我用数字打开这个文件时，它很好地显示了这一点，每一列都被记录了。但是，当我尝试使用Jupyter笔记本中的文件时，这些列似乎不能正常工作。以下是我所拥有的： %matplotlib inline import matplotlib import numpy as np import matplotlib.pyplot as plt import pandas as pd data = pd.read_table("filename.csv",encoding="utf-8") data.

浏览 0提问于2018-05-10得票数 1

回答已采纳

1回答

无法安全地转换传递给列%1中的对象数据类型数据的float64的数据类型

pandas、csv

我正在尝试使用panda读取csv文件，这是数据在csv文件中的外观。 Freq Level 2412 -84 2412 -85 2412 -90 2412 -83 2412 -83 下面是我的代码： import pandas as pd x_data = pd.read_csv(data_path, encoding='utf7', dtype=float) print(x_data) 然后我得到了错误“不能安全地转换传递的使用float64的数据类型作为对象数据类型的数据” ~/anaconda3/lib/python3.7/site-packages

浏览 63提问于2020-02-22得票数 0

1回答

无法分离属性的Python DataFrame

python、pandas、dataframe

我试图编写一个Python代码来训练一个数据集，以识别一个新闻条目是假的还是真的。我需要能够将数据放入列中，即属性和目标。“是讽刺的”列，其值为1或0，是目标。"article_link"列和“标题”是属性。数据集很大，由数千行组成。下面我只展示了其中的三行。我的问题是:给定一个原始的JSON文件，我将它转换成一个CSV文件，可以在Excel中读取。但是，当我在Python中显示数据时，属性并没有分开，它们集中在一列中，我不知道如何将它们分开。下面是我代码的一部分(我没有列出我所有的导入或学习)： import pandas as pd from pandas import

浏览 6提问于2019-11-27得票数 0

1回答

为什么pandas.to_csv要为整数写浮点数？

python、csv、types、pandas、type-conversion

我有下面的代码来解析一些csv数据。关键是最后几行，其余的只是为了显示上下文。基本上，我的数据中最后有三列，ID变量LopNr和case应该有整数“无论如何”，但为了以防万一，我将整个DataFrame转换成整数。为什么我要为结果csv文件中的LopNr列和年份列获取".0“，而第三列包含聚合数据的列实际上被转换为整数，并且输出时没有".0"？我认为，在.astype(int)之后，所有列都有整数，并且我们的输出到csv，而不将它们转换回浮动。 import iopro from pandas import * neuro = DataFrame() for ye

浏览 1提问于2014-05-02得票数 5

1回答

Pandas.io.sql read_frame()和to_csv()方法显示带有附加列的输出

python、sqlite、csv、pandas

下面是使用pandas.io.sql将输出存储到csv文件中所需执行的sqlite查询： sql2 = "select raw_contact_id as ID, group_concat(data1) as DETAILS from data group by raw_contact_id" table2 = sql.read_frame(sql2, conn2) table2.to_csv(cont_output, headers=True, index=False, encoding="utf8") 但我得到的输出如下： ID | DETAILS |

浏览 4提问于2016-01-26得票数 1

1回答

Pandas优化

python、numpy、pandas

我写了一个函数来处理pandas的数据。使用我的函数的%prun的分析日志张贴在底部(只有几行)。我想优化我的代码，因为我需要调用这个我写了超过4000次的函数。运行此函数一次需要37.7s。似乎最耗时的部分是numpy.ndarray的nonzero。因为我几乎所有的操作都是基于pandas的，所以我想知道pandas中的哪个函数严重依赖于这种方法？我的操作主要包括使用df.ix[]的基于datetimeindex的数据帧切片和使用pandas.merge()的数据帧合并。我知道不发布实际的脚本很难判断，但是脚本太长了，没有意义，而且大多数操作都是临时的，所以我不能把它重写成小脚本在这

浏览 2提问于2014-06-24得票数 0

1回答

关于matplotlib中的子图和子图的位置

python、matplotlib

我对分情节概念的理解有些困难。据我所知，子图是有组织的(行数、列数、图号或地块的位置)。我有这样的代码： from pandas import util import pandas.util.testing as testing import numpy as np import matplotlib.pyplot as plt import pandas as pd import matplotlib as mpl df = util.testing.makeDataFrame() with mpl.rc_context(rc={'font.family': '

浏览 5提问于2022-08-23得票数 2

回答已采纳

1回答

在逗号分隔字符串中查找浮点数的正则表达式

python、regex、regex-lookarounds、regex-group、regex-greedy

我有一个csv文件，其中有逗号分隔行，如下所示： "22.0,asc1.0$*xyz,12.00,12.00023000,,1.0asc1.0,,-12.4442,0.00000,5.2E-5\n" 我只想找到所有浮点数。挑战： "asc1.0$*xyz“--具有十进制但前缀/后缀为非数字的字符串应被忽略 "5.2E-5“-指数型应视为良好的结果。应该工作的第一个项目，开始没有逗号，最后一个项目结束没有逗号。这个表达式正确地捕获了浮点部分，但是不能正确地处理上述场景： [-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9

浏览 0提问于2018-08-15得票数 1

回答已采纳

1回答

在python中访问数据帧上的列

pandas

我正在做一个ML项目，作为我的Mtech的一部分，通过一个工作综合学习计划，我需要阅读错误数据库(输出为csv)，然后做一些分析。作为其中的一部分，我正在使用pandas数据帧加载CSV数据文件，但无法按名称或索引访问每一列。google中提供的示例确实提到了通过名称或索引访问它，但这两种方法都不适用于我。只是好奇的想知道我是不是错过了什么。 df.columns Index(['Identifier,Status,Priority,Severity,Found,DE-manager,Age,Component,Headline'], dtype='object&#

浏览 14提问于2021-03-21得票数 0

回答已采纳

1回答

IndexError:当使用Pandas将CSV列隐藏到列表时，对于大小为1的轴0，索引1是不允许的。

python、pandas、csv、indexing、indexoutofboundsexception

尝试制作一个相对简单的脚本，以帮助自动编写一些我必须做的注释。我正在讨论如何构造数据并与其交互，并决定尝试使用Pandas，因为它看起来非常健壮和直接。我希望将csv文件的每一列提取为一个列表，然后将其中一些列附加到不同的列表列表中。但是，每当我试图对文件做任何事情时，我都会得到以下错误：IndexError: index 1 is out of bounds for axis 0 with size 1。我一直在寻找如何解决这个问题，但我并不确定问题出在哪里。我对代码和数据进行了一系列不同的调整(除了语句，在执行之前检查零长度索引，再次检查数据集，以确保它正确对齐)。尽管如此，没有一个更接近

浏览 12提问于2022-10-11得票数 0

1回答

(Java String.format)无法将该列设置为固定宽度

java、string、string-formatting

首先，如果这样的事情已经得到了回答，我很抱歉。我试图搜索任何这样的问题，但我没有发现任何类似的(至少我使用的关键字)。请根据需要进行调整！这是我在网站上的第一篇文章。我正在用Java练习String.format，并且在使'Name‘列的元素宽度相同时遇到了困难。如果与此相关，我将使用JDK 9。在下面的代码中，问题在for循环块中。我从它们各自的字符串数组中获取名字和姓氏。我知道如果我把每个全名变成一个字符串，我可以解决我的问题，但是为了这个练习，为了提高我的Java技能，我想知道这个问题是否有解决方案。谢谢您:) public static void grades() {

浏览 2提问于2018-01-15得票数 1

回答已采纳

1回答

熊猫数据相关索引

python、pandas、indexing、dataframe

我想要一种简单的方法来访问相对于Pandas DataFrame中给定索引的索引。请参见下面的代码，其中绘制了与numpy数组的类比： import numpy as np import pandas as pd # let's make a simple 2d matrix like array na_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]) print na_a print na_a[1][2] print na_a[1+1][2] # here I want to print the next

浏览 1提问于2015-12-26得票数 3

回答已采纳

1回答

当我在数据帧列表中存储多个数据帧时，我回想起其中的一个，有没有一种方法可以格式化输出的列标题？

python、pandas、csv、dataframe、jupyter-notebook

我是Python和Stackoverflow的新手，所以请耐心等待。我有一个大约140k行的大型数据文件存储为csv。该文件被分成基于年龄组的部分，即。16-24，24-50等。在每次休息时，都会有关于受试者的年龄和性特征的信息线。在将csv加载到pandas之后，我尝试通过使用iloc划分年龄组的信息行来将数据帧拆分成几个较小的数据帧。现在我有了一个数据帧列表。我可以访问列表中的每个数据帧，没有问题，但是(我猜是由于信息行的原因) pandas在一列中显示所有信息。有没有一种方法可以格式化输出，并让pandas显示列标题，并将信息行放入列标题上方的标题中？我很抱歉，如果这不是非常清楚，请随

浏览 7提问于2019-05-29得票数 1

回答已采纳

1回答

在使用Dask pivot_table之后，我丢失了索引列

python、dask

在我使用pivot_table作为Dataframe并将数据保存到Parquet文件后，我正在松散索引列。 import dask.dataframe as dd import pandas as pd df=pd.DataFrame() df["Index"]=[1,2,3,1,2,3] df["Field"]=["A","A","A","B","B","B"] df["Value"]=[10,20,30,100,120,130] df 我的数据：

浏览 4提问于2017-03-06得票数 4

回答已采纳

1回答

用CASE语句按顺序处理数字

sql、sql-server、tsql

按顺序编号，请参考选择列表中的列序号位置。因此，以下查询相当于按'C.custid，C.C.region‘排序： SELECT C.custid, C.region FROM SALES.Customers AS C ORDER BY 1, c.region 现在，如果我使用一个CASE语句，希望对region列中的NULL值进行最后排序，那么我将执行如下操作： SELECT C.custid, C.region FROM SALES.Customers AS C ORDER BY CASE WHEN C.region IS NULL THEN 1 ELSE 0 END, C.re

浏览 1提问于2017-08-05得票数 0

回答已采纳

9回答

NumPy或Pandas:在具有NaN值的情况下保持数组类型为整数

python、numpy、int、pandas、type-conversion

有没有一种更好的方法来保持numpy数组的数据类型固定为int (或int64或其他任何类型)，同时内部仍有一个元素列为numpy.NaN 特别是，我正在将内部数据结构转换为Pandas DataFrame。在我们的结构中，我们有整数类型的列，它们仍然有NaN(但是列的dtype是int)。如果我们把它变成一个DataFrame，它看起来会把所有的东西都转换成一个浮点型，但我们真的很想成为int。有什么想法？尝试过的：我尝试在pandas.DataFrame下使用coerce_float=False下的from_records()函数，但没有帮助。我还尝试在NaN fill_value中

浏览 330提问于2012-07-19得票数 190

回答已采纳

1回答

Pandas中的行系列与Col系列

python、pandas、dataframe

行和列在本质上是否与数据对象相同？例如，在以下方面： import pandas as pd df = pd.DataFrame([ {"Title": "Titanic", "ReleaseYear": 1997, "Director": "James Cameron"}, {"Title": "Spider-Man", "ReleaseYear": 2002, "Director": "Sam Raimi"}

浏览 2提问于2020-08-16得票数 2

回答已采纳

3回答

pandas read_csv index_col=None不使用每行末尾的分隔符

python、pandas

我正在阅读“Python for Data Analysis”这本书，但在“Example: 2012联邦选举委员会数据库”部分将数据读取到DataFrame时遇到了问题。问题是其中一列数据总是被设置为索引列，即使index_col参数设置为None也是如此。下面是指向数据的链接：。下面是加载代码(为了节省检查时间，我设置了nrows=10)： import pandas as pd fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None) 为了保持简短，我排除了数据列输出，但以下是我的输出(请不要使用索引

浏览 2提问于2012-10-19得票数 63

回答已采纳

2回答

文本文件中的行和列坐标

python、pandas、position

我有一个包含大量数据的文本文件，并且我只想编辑一列。坐标开始于行4，列111，结束于行55，列111。下面是一个例子： // typTpt TypTpt NomTypTpt LibTypTpt TypDem Medic Motif Mutat Classe Dispo AnnDep AnnRdv AnnExclu HorRdv Ste TSupp TypHos AC , Etb_Debiteur , Art80 , WithForfait , RetSelAutre

浏览 2提问于2021-06-23得票数 0

1回答

通过熊猫和比罗转换模式

python、pandas、dataframe、pyarrow

我有一张熊猫的资料，我想用比罗把它写成一块拼花。我还需要能够指定列类型。如果我通过熊猫改变了类型，我就没有错误；但是当我通过pyarrow改变类型时，我会得到一个错误。见例子：给定的 import pandas as pd import pyarrow as pa data = {"col": [86002575]} df = pd.DataFrame(data) 通过潘达斯 df = df.astype({"col": "float32"}) table = pa.Table.from_pandas(df) 无差错通过PyArrow

浏览 5提问于2021-02-18得票数 3

回答已采纳

1回答

Python显示[“变量”]不在索引中，而是“变量”在

python、pandas、indexing

我需要读取csv文件，所以我有以下代码： import seaborn as sns import pandas as pd data=pd.read_csv("myfile.csv") 十，如果我跑 data.columns 我可以看到我有"armonia“、"letra”和“解释性”的列，有类似的内容。索引(‘armonia；letra；解释性’，dtype='object') 然后运行newdata=data[["armonia","letra"]]，得到以下错误： KeyError："&

浏览 0提问于2018-03-31得票数 2

1回答

如何在Python中将数据从excel列提取到列表中？

python、excel、list、pandas

我正在尝试从excel中的列中提取数据到Python中的列表。我有以下代码： #Extracting Labels read = pd.read_excel('Test-data-results.xlsx', sheetname=0) # can also index sheet by name or fetch all sheets labels = read['Labels'].tolist() print(labels) 当我运行这段代码时，我得到一个关键错误：.... File "pandas/_libs/index.pyx", lin

浏览 97提问于2018-08-13得票数 1

回答已采纳

2回答

在Python中，如何在一列中显示不同的小数位数

python、pandas、dataframe

我正在尝试在pandas数据框的一列中获取不同数量的小数。我已经将相关列中的值四舍五入为正确的小数位数，但是，整个列显示的是最大小数位数。例如，我有这样的数据帧： df = pd.DataFrame({'Column Name':[1005, 100.5, 10.05, 1.005]}) 1005.000 100.500 10.050 1.005 而我希望它是这样的： 1005 100.5 10.05 1.005 这怎麽可能？

浏览 1提问于2020-03-05得票数 2

1回答

熊猫默认使用Int64 (大写)，而不是默认的int64 (小写)。

pandas

我有潘达斯v0.24+，我正在浏览：通过尝试读取带有nan值的Integer列，我得到了通常的值错误。 ValueError:整数列在第33列中有NA值这是因为整数类型不能处理NA值。问题是，我实际上不知道我的csv的数据类型-我仍然希望熊猫‘推断’他们是什么。它是否可以在默认情况下使用Int64而不是int64来做到这一点，这样它就不会在进程中停止和抱怨NA值了吗？编辑:这就是发生的事情 df = pd.read_csv(file) 然后 Traceback (most recent call last): File "<input>",

浏览 5提问于2020-12-13得票数 3

1回答

将参数输入df.apply函数

python、pandas

我知道这是一个常见的问题，但我仍然感到困惑，尽管有许多这样的帖子。这是我的问题：我的职能是： def query_text_by_keyword(df, word_list): for word in word_list: if word in df.words: match = True else: match = False return match master_df['neg_query_match'] = master_df.apply(query_text_b

浏览 1提问于2020-02-10得票数 0

回答已采纳

3回答

如何在熊猫中添加排序功能？

python、pandas、sorting

我希望获得列值的排序顺序，并将其作为一个新列a_order。例如，值的顺序是列0.5 < 2.5 < 3.6中的a。因此，在列a_order中，0.5对应于0，2.5对应于1，3.6对应于2。 Input: import pandas as pd import numpy as np df = pd.DataFrame({'a':[0.5, 3.6, 2.5]}) Output: a 0 0.5 1 3.6 2 2.5 Expected: a a_order 0 0.5 0 1 3.6 2 2 2.

浏览 1提问于2018-11-02得票数 3

回答已采纳

1回答

read_excel in DataFrame中的多个索引(TypeError:列表索引必须是整数，而不是str)

python、pandas、dataframe

如果以前有人问过这个问题，很抱歉。我做了一些研究，但仍然无法使我的代码正常工作。我正在尝试将excel文件读取到数据文件中。 import numpy as np import pandas as pd import io file1 = "Book1.xlsx" Infile = pd.read_excel(file1,Sheet_Name = 'Sheet6',index_col =['DOCO','LEAST','LEASPN']) Infile.head() print "Test"

浏览 0提问于2019-03-13得票数 0

回答已采纳

1回答

用Pandas写入特定范围/列

python、excel、python-3.x、pandas、xlsxwriter

我试图通过Pandas数据帧从工作簿1的列范围AP:AR复制到工作簿2的范围A:C。我已经成功地读取了工作簿1中下面的数据框架，然后我想将它写入指定范围的工作簿2中。所以AP:AR to AQ:AS. 我试过： #df.to_excel(writer, 'AP') 我还尝试了以下几点： #df = pd.write_excel(filename, skiprows = 2, parse_cols = 'AP:AR') pd.writer = pd.ExcelWriter('output.xlsx', columns = 'AP:AR&

浏览 0提问于2017-11-16得票数 1

回答已采纳

1回答

如何指定Pandas读取哪些列？

dataset、pandas、data

我有一个巨大的数据集，有47万行和1400个列。我只需要184个可用的列。为了提高数据集的加载时间，我想限制我所读的列。如何指定像pandas.read_csv()这样的函数读取的列？

浏览 0提问于2022-11-23得票数 0

回答已采纳

1回答

我如何使用Arrow在CSV中穿行？

python、pyarrow、apache-arrow

我想做什么，我使用来读取一些CSV并将它们转换为Parquet。我所读的一些文件有很多列，内存占用也很大(足以使运行作业的机器崩溃)。我试图在读取CSV的同时，以类似于Pandas 和chunksize的工作方式来浏览文件。例如，这就是分块代码在熊猫中的工作原理： chunks = pandas.read_csv(data, chunksize=100, iterator=True) # Iterate through chunks for chunk in chunks: do_stuff(chunk) 我想将类似的功能移植到Arrow 我想做什么，我注意到Arrow有，它包

浏览 1提问于2021-07-28得票数 5

回答已采纳

1回答

谷歌图表编号

javascript、php、charts、google-analytics、google-visualization

我用谷歌图表从谷歌分析中获得数据，在我的网站上看到它，有一些数据有小数，如何使图表忘记小数之后的数字。我在为图表生成的数据中使用了php foreach，如下所示： var data = google.visualization.arrayToDataTable([ ['WEEK', 'total Cost' ,{ role: 'annotation' } ], <? foreach($SOMETHING->getRows() as $row) {

浏览 0提问于2016-09-06得票数 0

回答已采纳

1回答

Pandas: Read_csv，缺少逗号

python、pandas、csv

如果我打开csv文件使用编辑器一切都很好，但是当我通过pandas read_csv导入它时 t1= pd.read_csv (r'C:\Users\User\Documents\UNI\Bachelor\Hotmaps\2010Profiles\ninjatemp.csv') 温度列中的大多数逗号都丢失了(如图所示)。你知道这里出了什么问题吗？

浏览 14提问于2021-06-04得票数 0

3回答

Pandas在使用read_csv时添加小数点

python、pandas、csv

我正在处理一些csv文件，并使用pandas将它们转换为数据帧。之后，我使用一个输入来查找要删除的值我遇到了一个小问题:对于某些列，它会将".o“添加到列中的值中。它只在包含数字的列中执行此操作，所以我猜它将该列读取为一个浮点数。如何防止这种情况发生？真正让我困惑的是，它只发生在几个列中，所以我不能完全弄清楚模式。我需要去掉".0“，这样我才能重新导入它，而且我觉得从一开始就防止它发生是最容易的。谢谢! 下面是我的代码示例： clientid = int(input('What client ID needs to be deleted?')) df1

浏览 134提问于2019-01-11得票数 2

1回答

Pandas数据帧按索引选择行，按名称选择列

python、pandas、pandas-loc

有没有办法在pandas数据框中按索引(即整数)和按列名选择行？我尝试使用loc，但它返回一个错误，我知道iloc只适用于索引。这里是数据帧df的第一行。我愿意选择第一行，名为“卷”的列，并尝试使用df.loc0“卷”。 ?

浏览 12提问于2021-08-05得票数 0

1回答

iloc函数在熊猫和Python中有什么优势？

python、python-3.x、pandas

我刚开始学习Python和Pandas，在许多教程中我看到了iloc函数的使用。人们总是说，您可以使用这个函数来引用dataframe中的列和行。但是，您也可以不使用iloc函数直接这样做。下面是一个输出相同的例子： # features is just a dataframe with several rows and columns features = pd.DataFrame(features_standardized) y_train = features.iloc[start:end] [[1]] y_train_noIloc = features [start:end] [[1

浏览 2提问于2020-10-21得票数 2

回答已采纳