在pandas dataframe中根据混合数据类型查找相似行_在Pandas Dataframe中查找相似行并减去特定列值_在Pandas DataFrame中查找数值最接近的行 - 腾讯云开发者社区

python、pandas

在调用pandas数据框上的dtype属性时，输出的最后一行通常是dtype: object。例如： In [1]: import pandas as pd In [2]: df = pd.DataFrame({'numbers':100,'floats': 5.75,'name':'Jill'},index=['a']) In [3]: df.dtypes Out[3]: numbers int64 floats float64 name object dtype: object 输出中的dtype:

浏览 44提问于2020-09-10得票数 1

回答已采纳

2回答

从熊猫DataFrame中提取一行时保存dtype

python、pandas、numpy、dataframe、dtype

从一个 DataFrame (例如使用.loc或.iloc)中提取单个pandas行DataFrame会产生pandas Series。但是，在处理DataFrame中的异构数据时(即DataFrame的列并不都是相同的dtype)，这会导致行中不同列的所有值被强制转换为单个dtype，因为Series只能有一个dtype。这里有一个简单的例子来说明我的意思： import numpy import pandas a = numpy.arange(5, dtype='i8') b = numpy.arange(5, dtype='u8')**2 c = num

浏览 2提问于2020-06-29得票数 0

3回答

将大型数据集加载到Pandas Python中

python、csv、pandas

我想从InstaCart 加载大型.csv (340万行，206k用户)开源数据集基本上，我在将orders.csv加载到Pandas DataFrame时遇到了问题。我想学习将大文件加载到Pandas/Python中的最佳实践。

浏览 3提问于2017-06-14得票数 1

2回答

无法用DataFrame API上载包含混合类型数据的DolphinDB。

python、pandas、dolphindb

我尝试用Python上传DataFrame。它包含一个混合类型的列。 import dolphindb as ddb import pandas as pd sess = ddb.session('localhost', 8848) df = DataFrame({'a': [1, 1.0, 'a']}) sess.upload({'df': df}) 然后，我得到以下错误消息：跟踪(最近一次调用)：文件""，第1行，在文件"/home/ynwang/.local/lib/python3.6/sit

浏览 2提问于2020-02-10得票数 0

1回答

使用NetworkX根据相似度绘制节点间的边？

python-3.x、pandas、graph、networkx、record-linkage

这是我的玩具节点dataframe： import pandas as pd df = pd.DataFrame({ 'id': [1, 2, 3, 4, 5], 'a': [55, 2123, -19.3, 9, -8], 'b': ['aa', 'bb', 'ad', 'kuku', 'lulu'] }) 我正在用节点构建一个图( df的每一行都是一个具有id和属性的节点)：

浏览 11提问于2022-02-23得票数 1

1回答

在Pandas DataFrame中添加Pandas系列作为行

python、python-3.x、pandas、dataframe、series

我正在尝试将Pandas.Series作为新行添加到Pandas.DataFrame中。但是，“系列”似乎总是被添加，其索引以个别行的形式出现。我们如何将其附加为一行呢？ import pandas as pd df = pd.DataFrame([ ('Tom', 'male', 10), ('Jane', 'female', 7), ('Peter', 'male', 9), ], columns=['name', 'gender',

浏览 0提问于2019-11-08得票数 6

回答已采纳

2回答

如何根据属性子集(4个属性)对数据进行聚类？

python、cluster-analysis、data-mining、data-analysis、hierarchical-clustering

我有一个pandas DataFrame，它保存了一些对象的数据，其中包括对象某些部分的位置(左、上、右、下)。例如： ObjectID Left, Right, Top, Bottom 1 0 0 0 0 2 20 15 5 5 3 3 2 0 0 如何根据这4个属性对对象进行聚类？你有没有推荐给我的聚类算法/技术？

浏览 0提问于2019-03-21得票数 0

1回答

熊猫数据集-集行等于其他行

python、pandas、dataframe

对于这个基本的dataframe，我希望设置与其他行相等的行。我毫不费力地一排一排地做这件事： import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10, 5)) df.loc[6,:] = df.loc[4,:] 但是，当我试图对多个行执行此操作时，它们被设置为NaN，而不是我所引用的行： import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10, 5)) df.loc[5:6,:] = df.loc[

浏览 0提问于2014-03-15得票数 5

回答已采纳

1回答

Pandas中的行系列与Col系列

python、pandas、dataframe

行和列在本质上是否与数据对象相同？例如，在以下方面： import pandas as pd df = pd.DataFrame([ {"Title": "Titanic", "ReleaseYear": 1997, "Director": "James Cameron"}, {"Title": "Spider-Man", "ReleaseYear": 2002, "Director": "Sam Raimi"}

浏览 2提问于2020-08-16得票数 2

回答已采纳

2回答

将行添加到DataFrame时，列的格式会发生变化

python、pandas

我向DataFrame中添加了一行，当我调用describe时，它不再输出数字汇总值。 import pandas as pd import numpy as np myDataset = {"Movie Title": ['Avengers: Endgame', 'Avatar', 'Titanic', 'The Lion King'], "Gross": [ 2797800564, 279

浏览 36提问于2020-04-17得票数 2

回答已采纳

1回答

熊猫drop_duplicates在朱庇特笔记本和巨蟒脚本之间没有一致的工作

python、pandas、jupyter-notebook、drop-duplicates

我正在将条目添加到现有的dataframe中，在那里它们可以是新的，也可以是现有的dataframe中的更新。通过使用Pandas drop_duplicates，旧的和过时的条目将被删除。Pandas drop_duplicates在木星笔记本上正常工作： df.drop_duplicates(keep = 'last', inplace = True, subset = ['col_a', 'col_b', ...]) 但是，当我将代码转移到python脚本并通过CLI运行它时，复制的/过时的条目没有被删除。因此，我创建了另一个python

浏览 3提问于2019-12-11得票数 1

2回答

Pandas、numpy.where()和numpy.nan

python、pandas、dataframe、numpy、nan

我想使用numpy.where()向pandas.DataFrame添加一列。我想对条件为false的行使用NaN值(以指示这些值是“缺失的”)。考虑一下： >>> import numpy; import pandas >>> df = pandas.DataFrame({'A':[1,2,3,4]}); print(df) A 0 1 1 2 2 3 3 4 >>> df['B'] = numpy.nan >>> df['C'] = numpy.wher

浏览 144提问于2021-05-11得票数 5

回答已采纳

1回答

Pandas和Scipy TypeError：“NoneType”和“float”的实例之间不支持“<”

python、pandas、numpy、scipy、algorithmic-trading

import numpy as np import pandas as pd import math from scipy import stats hqm_columns = [ 'Ticker', 'Price', 'Number of Shares to Buy', 'One-Year Price Return', 'One-Year Return Percentile', 'Six-Month Price Return',

浏览 24提问于2021-02-18得票数 1

1回答

无法在Python中使用Pandas或Blaze加载大文件(~2gb)

python-2.7、pandas、blaze、large-data

我有一个超过500万行和20个字段的文件。我想在Pandas中打开它，但是内存出现了错误： pandas.parser.CParserError: Error tokenizing data. C error: out of memory 然后我读了一些关于类似问题的文章，发现了烈火，但是按照三种方法(.Data，.CSV，.Table)，都没有明显的效果。 # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import re import numpy as np import sys import

浏览 3提问于2015-10-15得票数 1

回答已采纳

1回答

用Pandas实现从Excel到HDF5的转换

python、excel、pandas、dataframe、hdf5

我希望将Excel文档的内容提取到熊猫数据中，然后将该数据写入HDF5文件。为了做到这一点，我做了以下工作： xls_df = pd.read_excel(fn_xls) xls_df.to_hdf(fn_h5, 'table', format='table', mode='w') 这将导致以下错误： TypeError:不能序列化列Col1，因为它的数据内容是unicode对象dtype 我尝试在来自Excel文件的dataframe上使用convert.objects()，但是这不起作用(并且convert.objects()是不推荐

浏览 5提问于2016-09-02得票数 1

回答已采纳

2回答

选择行时避免类型转换

python、pandas、typing

我有一个具有强制数据类型的DataFrame，这些数据类型对我的应用程序非常重要： df = (pd.DataFrame([(1, 1, 1000), (1, 2, 2000)], columns=['id', 'fk', 'value']) .astype({'id': pd.Int32Dtype(), 'fk': pd.Int32Dtype(), '

浏览 10提问于2021-12-21得票数 2

1回答

方法，而不是在Dask的多处理过程中调用一次调用

python、pandas、multiprocessing、dask

我正在尝试从google存储桶下载一个文件并解析它们。有数百万这样的文件，需要下载，分析和做一些操作(自然语言处理等)。我正在使用dask的并行处理来尝试下面的代码，它正在工作，但是它调用extract_skill两次，而不是对熊猫的数据文件中的每一行调用一次。请帮助我理解为什么要调用两次extract_skill方法。 import pandas as pd import numpy as np import dask import dask.dataframe as dd # downloading file and extract skill sets and store in sk

浏览 5提问于2019-09-19得票数 1

2回答

如何使用布尔型DataFrame ("IndexError:条目长度2而不是3“)访问Pandas MultiIndex中的行。

python、pandas

考虑一个具有所有布尔型级别的MultiIndex的Pandas DataFrame (例如下面的例子)。试图使用布尔标签访问此类DataFrame的特定行会导致错误： df = pd.DataFrame([[False, False, 1], [False, True, 2], [True, False, 3]], columns=["A", "B", "C"]) df.set_index(["A", "B"], inplace=Tru

浏览 5提问于2020-03-07得票数 1

回答已采纳

1回答

熊猫简易保存数据类型

pandas

下面的代码出现了一个简单的错误。我的目标是使用simpleimputer在一张照片中插入不同数据类型的缺失值。当我尝试这样做时，fit_transform似乎不像预期的那样工作。当不使用dtype参数时，代码工作得很好，但是最终的dataframe丢失了它的数据类型信息。当我在参数中包含dtype列表时，我会看到下面的错误。您应该能够通过在本地复制和粘贴来模拟错误。 import pandas as pd import numpy as np from sklearn.impute import SimpleImputer import sklearn print(sklearn.__v

浏览 2提问于2018-11-11得票数 2

回答已采纳

1回答

将单元与Pandas DataFrame关联

python、csv、pandas

我使用的web服务返回CSV响应，其中第一行包含列名，第二行包含列单位，例如： longitude,latitude degrees_east,degrees_north -142.842,-1.82 -25.389,39.87 -37.704,27.114 我可以将这个读入熊猫的DataFrame中： import pandas as pd from StringIO import StringIO x = ''' longitude,latitude degrees_east,degrees_north -142.842,-1.82 -25.389,39.87 -

浏览 0提问于2013-05-07得票数 2

回答已采纳

3回答

Numpy获取每列的数据类型

python、pandas、numpy、types、data-science

我需要获取每个列的类型，以便对其进行适当的预处理。目前，我通过以下方法做到这一点： import pandas as pd # input is of type List[List[any]] # but has one type (int, float, str, bool) per column df = pd.DataFrame(input, columns=key_labels) column_types = dict(df.dtypes) matrix = df.values 由于我只使用pandas获取数据类型(每列)，而使用numpy获取其他所有内容，因此我希望将panda

浏览 2提问于2018-11-30得票数 4

1回答

访问行时丢失单元格格式

python、pandas、numpy

在某些情况下，单元格的格式(int、float等)在通过行访问时会丢失。在该示例中，第一列具有整数，第二列具有浮点数。但是111被转换为111.0。 dfA = pandas.DataFrame({ 'A': [111, 222, 333], 'B': [1.3, 2.4, 3.5], }) # A 111.0 # B 1.3 # Name: 0, dtype: float64 print(dfA.loc[0]) # <class 'numpy.float64'> print(type(dfA.l

浏览 6提问于2022-12-04得票数 0

回答已采纳

3回答

在Pandas列中查找混合类型

python、pandas

在解析数据文件时，我经常会收到这样的警告： WARNING:py.warnings:/usr/local/python3/miniconda/lib/python3.4/site- packages/pandas-0.16.0_12_gdcc7431-py3.4-linux-x86_64.egg/pandas /io/parsers.py:1164: DtypeWarning: Columns (0,2,14,20) have mixed types. Specify dtype option on import or set low_memory=False. data

浏览 0提问于2015-04-01得票数 21

回答已采纳

1回答

熊猫DataFrame/系列值格式化问题

python、pandas

让我举一个例子： df = pd.DataFrame(np.arange(6).reshape(3, 2), columns=list('ab')) print(df) a b 0 0 1 1 2 3 2 4 5 比方说，我想选择一个列'a‘== 0的行，并且我知道在我的dataframe中只有一个行满足这个条件。 df1 = df.loc[df['a'] == 0] print(df1) a b 0 0 1 type(df1) pandas.core.frame.DataFrame df2 = df.loc[0] p

浏览 1提问于2017-05-21得票数 2

回答已采纳

1回答

在pandas np.where子句中无法识别NaN。为什么？还是说这是个bug？

python、numpy、pandas

在pandas np.where子句中无法识别NaN。为什么？还是说这是个bug？这段代码的最后一行应该是"True“ In [1]: import pandas as pd In [2]: import numpy as np In [3]: a=pd.Series([1,np.nan]) In [4]: b=pd.DataFrame(["a","b"]) In [5]: b["1"]=np.where( a.isnull(), np.nan,

浏览 0提问于2016-01-13得票数 5

回答已采纳

1回答

创建一个每个值只有1行的新数据帧

python、pandas

我正在尝试用原始数据帧(Dataframe 1)中的行填充pandas数据帧(Dataframe 2)。我在下面创建了一个模拟的Dataframe 1： Ref Number Name 1 Alpha 2 Alpha 3 Alpha 4 Alpha 5 Beta 6 Beta 7 Beta 8 Charlie 我想删除在以前的行中出现值名称的行。也就是说，Dataframe 2应该如下所示 Ref Number Name 1

浏览 20提问于2017-07-07得票数 1

回答已采纳

1回答

不能使用简单的条件语句修改DataFrame。但在使用静态数字时有效

python、pandas、numpy

我正在尝试使用DataFrame ()函数更改pandas iterrows对象的序列。DataFrame充满了随机浮点数。下面是两段代码的示例：这个可以用： for index,row in other_copy.iterrows() other_copy.loc[index] = (other_copy.loc[index] > 30) 但这一条不是： for index,row in other_copy.iterrows(): top_3 = other_copy.loc[index].nlargest(3) minimum = min(top_3)

浏览 18提问于2018-12-22得票数 0

回答已采纳

1回答

熊猫的合并只返回NaN值

python、pandas、merge

我正在尝试合并两个数据格式：'new_df‘和'df3’。new_df包含年份和月份，df3包含年份、月份和其他列。我已经将大多数列转换为object，并试图将它们合并。合并‘工作’不返回错误，但我的最后一个数据块都是空的，只有年份和月份的列是正确的。 new_df <class 'pandas.core.frame.DataFrame'> RangeIndex: 119 entries, 0 to 118 Data columns (total 3 columns): # Column Non-Null Count Dtype

浏览 2提问于2022-11-08得票数 0

1回答

为什么在Pandas中调用apply函数时更改了数据类型？

python、pandas

在使用apply函数处理DataFrame时，意外地更改了列的数据类型。我该怎么做才能防止这种情况发生？例如： In [1]: import pandas as pd In [2]: from pandas import DataFrame In [3]: tmp = DataFrame({'item':[1,2,3]}) In [4]: tmp['score'] = 0.0 In [5]: tmp.dtypes Out[5]: item int64 score float64 dtype: object In [6]: tmp O

浏览 1提问于2016-10-29得票数 0

回答已采纳

1回答

如何删除包含75%缺失值的行，以及使用何种归责技术？

r、na、missing-data

我有一个dataframe 17631x15，并且希望找到一种简单的方法来删除包含75%缺失值的行。我不知道如何在一个函数中填充阈值： out<- rowSums(is.na(df)) 我的数据显示出强烈的日变化和季节变化，我想知道缺失的值是否可以用几何平均值代替？

浏览 0提问于2020-02-04得票数 0

回答已采纳

1回答

Pandas DataFrame.values转换错误或功能？

python、pandas

对于pandas (v0.18.0)似乎正在为DataFrame的values属性执行的一些“幕后”转换，我遇到了一些困难。我有一个如下所示的数据集： data = [(1473897600000000, 9.9166, 1.8621, 15), (1473897660000000, 19.9166, 3.8621, 20), (1473897720000000, 29.9166, 5.8621, 25), (1473897780000000, 39.9166, 7.8621, 30)] 每个元组的第一个元素表示以微秒为单位的POSIX UT

浏览 0提问于2016-09-30得票数 2

3回答

如何用numpy另一种方式创建2D数组？

python、pandas、numpy

我为numpy和熊猫创建了一个2D数组，如下所示： import numpy as np import pandas as pd data = np.array([['','A','B','C'], ['0','1','2','3'], ['1','4','5','6'], ['2','7',

浏览 2提问于2018-08-15得票数 0

回答已采纳

2回答

熊猫的整数切片不同的行和列？

python、pandas

来自R，我试着让我的头为熊猫数据切片整数。令我困惑的是，使用相同的整数/切片表达式对行和列进行不同的切片行为。 import pandas as pd x = pd.DataFrame({'a': range(0,6), 'b': range(7,13), 'c': range(14, 20)}) x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2? a b 0 0 7 1 1 8 2 2 9 我

浏览 2提问于2015-12-28得票数 3

回答已采纳

2回答

如何在pandas中创建混合类型数据

python、pandas、mixed-type

这是一个相当不标准的问题。出于教育目的，我尝试在csv文件中创建一个混合类型的列，以便在pandas DataFrame中导入数据集时收到一条警告消息，并在以后处理该列以显示它是如何完成的。问题是，我在Excel的字符串列中键入0，保存它并关闭文件，但聪明的熊猫仍然将该列作为字符串列导入，因此它不会检测到其中是否确实存在浮点数。我还尝试使用astype('float')、导出和重新导入来更改pandas中仅这些0的格式。还是不管用。有没有人知道如何创建一个pandas将读取混合类型的列？提前感谢！

浏览 8提问于2020-02-09得票数 0

2回答

为什么潘达斯要强迫我的矮胖的float32去float64？

python、numpy、pandas、coercion

为什么Pandas强迫我的numpy float32在这段代码中使用float64： >>> import pandas as pd >>> import numpy as np >>> df = pd.DataFrame([[1, 2, 'a'], [3, 4, 'b']], dtype=np.float32) >>> A = df.ix[:, 0:1].values >>> df.ix[:, 0:1] = A >>> df[0].dtype dtype

浏览 1提问于2016-02-05得票数 7

1回答

如何使用一系列的列名从pandas数据框中获取一个系列？

python、pandas、indexing、slice、data-wrangling

我有一个包含数字数据的pandas dataframe df。我还有一个系列s，它的索引与df相同，值由df列标签组成，例如 import pandas as pd df = pd.DataFrame( index=[0, 1, 2], columns=[0, 1, 2], data=[[1, 2, 3], [4, 5, 6], [7, 8, 9]] ) s = pd.Series(index=[0, 1, 2]), data=[0, 1, 2]) 如何使用s对df进行切片，并获取另一个系列s1，该系列包含与s中的df对相对应的(index, value)值，作为它们在df中

浏览 19提问于2020-08-06得票数 3

回答已采纳

1回答

寻找不同大熊猫数据的余弦相似性

python、pandas、cosine-similarity

我有三只熊猫，假设group_1，group_2，group_3 import pandas as pd group_1 = pd.DataFrame({'A':[1,0,1,1,1], 'B':[1,1,1,1,1]}) group_2 = pd.DataFrame({'A':[1,1,1,1,1], 'B':[1,1,0,0,0]}) group_3 = pd.DataFrame({'A':[1,1,1,1,1], 'B':[0,0,0,0,0]}) 填充的虚拟值，对于上述组

浏览 3提问于2022-09-03得票数 1

回答已采纳

1回答

Python:删除字符串中的指数

pandas

我一直在尝试删除字符串中的指数，最长的时间都没有用。该列包含包含字母表的字符串以及超过24位的长数字。我尝试使用.astype(str)将列转换为字符串，但它只将行读取为"1.234123E+23“。该表的一个示例是 A 345223423dd234324 1.234123E+23 如何让表格显示pandas中的完整数字字符串？

浏览 16提问于2020-02-17得票数 0

3回答

为什么一种使用iloc()提供SettingWithCopyWarning，而另一种则没有？

python、pandas、dataframe、copy

在类的方法中，我使用以下语句： self.__datacontainer.iloc[-1]['c'] = value 为此，我得到了一个"SettingWithCopyWarning:值试图设置在来自DataFrame的切片的副本上“。现在，我尝试复制此错误并编写以下简单代码： import pandas, numpy df = pandas.DataFrame(numpy.random.randn(5,3),columns=list('ABC')) df.iloc[-1]['C'] = 3 在那里我没有错误。为什么我在第一条语句而不是

浏览 0提问于2018-12-16得票数 5

回答已采纳

2回答

如何在使用django ORM加载数据之前强制使用列数据类型

python、django、pandas、dataframe、django-orm

我们使用pandas (v0.25.3)从通过Django ORM (django v2.2.6)访问的postgres数据库中的大型数据集运行分析和数据操作。我们遇到的情况是，我们要导入到DataFrame的表包含一个存储为models.BigIntegerField的外键ID列。这个外键字段通常是一个很大的数字，但是在那些没有设置外键的行中也可以是null。当我们将记录列表从Django查询集中导入到新的pandas DataFrame中时，pandas会将ID列的dtype设置为np.float64，因为该数据包含一些空值。但是，对于那些ID不为null的行，从BigInteger

浏览 19提问于2020-12-19得票数 0

2回答

初始化空DataFrame并追加行

python、pandas、dataframe、append、concat

与不同，我有许多数据帧需要连接。如果只有两个数据帧，我可以这样做： df1 = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB')) df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB')) df1.append(df2, ignore_index=True) 想象一下，每当我将一个新文件读入DataFrame对象时，都需要追加/连接数百万个df。但是当我尝试初始化一个空的数据帧，然后通过循环添加新的数据帧时： import pandas as pd a

浏览 0提问于2017-04-03得票数 1

回答已采纳

1回答

为什么dask_ml.preprocessing.OrdinalEncoder.transform会产生不按序号编码的结果？

dask、dask-dataframe、dask-ml

我对的结果感到困惑 from sklearn.preprocessing import OrdinalEncoder from dask_ml.preprocessing import OrdinalEncoder as DaskOrdinalEncoder import numpy as np import pandas as pd N = 10 np.random.seed(1234) df = pd.DataFrame({ "cat1": np.random.choice(list(string.ascii_uppercase)[0:3], size=N),

浏览 7提问于2021-05-07得票数 0

回答已采纳

2回答

新的Dataframe列作为其他行的通用函数(熊猫)

python、pandas、dataframe、vectorization

是在 DataFrame 中创建一个新列的最快(也是最有效)的方法，它是 pandas 中其他行的函数。请考虑以下示例： import pandas as pd d = { 'id': [1, 2, 3, 4, 5, 6], 'word': ['cat', 'hat', 'hag', 'hog', 'dog', 'elephant'] } pandas_df = pd.DataFrame(d) 产生的结果： id word 0 1 ca

浏览 2提问于2018-01-09得票数 4

回答已采纳

1回答

Pandas df.astype('float32')失去了很多精度

python、python-3.x、pandas、dataframe、precision

为什么Pandas.DataFrame中的float64值123456789.0会转换为123456792.0，只保留7位有效数字？ import pandas as pd df = pd.DataFrame([123456789.0]) # 0 # 0 123456789.0 df = df.astype('float32') # 0 # 0 123456792.0

浏览 3提问于2019-11-30得票数 0

1回答

从Python中的Azure存储递归读取多个json文件

python、json、azure-blob-storage、azure-storage

我正在使用下面的代码从azure存储中读取多个json文件。 from azure.storage.blob import BlobServiceClient, BlobClient, ContainerClient import json import json import pandas as pd from pandas import DataFrame from datetime import datetime import uuid connect_str = "" blob_service_client = BlobServiceClient.from_connec

浏览 3提问于2022-07-13得票数 0

回答已采纳

1回答

为什么在两个类似的DataFrames上切片的工作方式不同？

python、pandas

我理解Pandas上的切片，DataFrames以DataFrame的形式返回行，如果没有选择行，应该返回空的DataFrame。我的问题是关于我在Pandas 1.2.0中尝试的两个例子之间的差异第一个关于结果的空dataframe (正如我所期望的)： >> df = pd.DataFrame(np.arange(4 * 4).reshape(4, 4), index=['r1', 'r2', 'r3', 'r4'], c

浏览 3提问于2021-08-15得票数 1

回答已采纳

2回答

TypeError:需要一个整数(got类型str)

python、pandas、parquet

我有一个具有以下数据类型的dataframe： [2020-02-06 19:15:06,579] {logging_mixin.py:95} INFO - campanha object chave_sistema_origem int64 valor_ajustado object 列valor_ajustado有一些值，当我试图使用df.to_parquet(buffer, index=False)编写一个拼花文件时，它会抛出一个异常。 [2020-02-06 19:15:06,597] {ta

浏览 1提问于2020-02-06得票数 3

3回答

根据对象的类型从DataFrame中选择行(即字符串)

python、pandas

所以有一个DataFrame说： >>> df = pd.DataFrame({ ... 'A':[1,2,'Three',4], ... 'B':[1,'Two',3,4]}) >>> df A B 0 1 1 1 2 Two 2 Three 3 3 4 4 我想选择特定列的特定行的数据类型为str类型的行。例如，我想选择A列中数据的type为str的行。因

浏览 4提问于2016-09-01得票数 27

回答已采纳

1回答

多处理组应用python

python、python-2.7、pandas、python-multiprocessing

我有两个组，一个是要作为组处理的行，另一个是要查看的组。 test = pd.DataFrame({'Address1':['123 Cheese Way','234 Cookie Place','345 Pizza Drive','456 Pretzel Junction'],'city':['X','U','X','U']}) test2 = pd.DataFrame({'Address1':['123 c

浏览 16提问于2017-06-22得票数 1

回答已采纳

2回答

对pandas DataFrame中的空值使用None而不是np.nan

python、pandas、dataframe

我有一个混合数据类型的pandas DataFrame。我想将所有空值替换为None (而不是默认的np.nan)。出于某种原因，这似乎几乎是不可能的。实际上，我的DataFrame是从csv中读入的，但这里有一个简单的混合数据类型的DataFrame来说明我的问题。 df = pd.DataFrame(index=[0], columns=range(5)) df.iloc[0] = [1, 'two', np.nan, 3, 4] 我做不到： >>> df.fillna(None) ValueError: must specify a fill met

浏览 1提问于2016-09-02得票数 39

回答已采纳