isinstance()不检测pandas数据帧列的类型_pandas数据帧类型不匹配_使用none类型的测试列pandas数据帧 - 腾讯云开发者社区

python、pandas、dataframe

我使用toPandas()将pyspark数据帧转换为pandas数据帧。但是，因为某些数据类型不对齐，所以pandas会将数据帧中的某些列强制转换为object。我想用实际的字符串在我的列上运行.str，但似乎不能让它工作(如果没有显式地找到首先要转换的列)。我遇到了 AttributeError: Can only use .str accessor with string values! 我已经尝试过df.fillna(0)和df.infer_objects()，但都没有用。我似乎不能让对象注册为int64或float64，所以我不能这样做 for col in df.columns:

浏览 1提问于2020-06-23得票数 1

1回答

区分pandas数据帧中的小数列和字符串列

python、pandas、types、decimal、dtype

我需要识别数据帧中哪些列是小数，哪些是字符串。使用df.dtypes为两种列类型提供'object‘： import pandas as pd import decimal data = {'dec1': [1.1, 1.2],'str1': ["a","b"]} df = pd.DataFrame(data) df.dec1 = df.dec1.apply(lambda x: decimal.Decimal(x)) df.dtypes 我使用下面的代码来知道哪些是小数，但是对于如此基本的东西，必须有更

浏览 0提问于2020-04-09得票数 0

1回答

逗号分隔的in字符串映射到python Pandas中的值

python、pandas

我在pandas DataFrame的列中有一个逗号分隔的字符串： ? 我有一个映射数据帧 ? 我想要最终的数据帧： ? 我想要一个新的列，并用映射数据帧中的值替换ids，写pythonic + pandas的方法是什么？

浏览 22提问于2021-11-02得票数 0

回答已采纳

2回答

如何确定数据帧是Pandas还是Spark？

pandas、apache-spark、dataframe

我将一个数据帧传递给一个函数。有时是Pandas数据帧，有时是Spark数据帧。我的函数需要采取相应的行动。有没有简单的方法，比如df.isPandas()，来确定一个数据帧(作为“df”接收)是Pandas数据帧还是Spark数据帧？提前谢谢。

浏览 17提问于2019-05-14得票数 1

回答已采纳

2回答

清理数据集。如果单元格包含"<“、”做X、如果“>、”用函数做Y“或”应用“。希望所有列只包含浮动

python、pandas

My包含88个列(元素)，这些列(元素)最好包含浮点数。但这些数据有些东西需要清理。我曾经尝试过迭代()的想法，但我在这里读到，人们建议不要使用它，使用函数，并应用于df以提高效率。我想解决的三个主要问题are:BDL =低于检测极限->用NA"<“-->替换<符号，然后将单元格”>“-->删除符号中剩余值的一半样本数据： |---------------------|------------------|------------------|------------------| | Be_ppm | Bi_pp

浏览 3提问于2020-07-06得票数 0

回答已采纳

1回答

在Pandas数据帧元素上应用条件

python、pandas、lambda、conditional-statements、apply

我正在学习Python，我试图理解apply()方法在Pandas数据帧中是如何工作的。作为练习，我想使用一行代码对Pandas dataframe的元素应用str.upper()方法，前提是这些元素是字符串。我想将lambda条件表达式与apply结合使用，但问题是，当apply调用Pandas dataframe时，dataframe --如果我理解得很好的话--返回一个要应用的Series，然后将其传递给函数。我想知道如何才能更深入，并在Pandas数据帧的元素上调用函数。这就是我在DataFrame (a Series)的一个列上调用apply()时想要做的事情： df= pd.

浏览 5提问于2017-01-22得票数 7

回答已采纳

2回答

检查变量是否为dataframe

python、pandas

当我的函数f被一个变量调用时，我想检查var是否是一个pandas数据帧： def f(var): if var == pd.DataFrame(): print "do stuff" 我想解决方案可能很简单，但即使是 def f(var): if var.values != None: print "do stuff" 我不能让它像预期的那样工作。

浏览 1提问于2013-02-11得票数 184

回答已采纳

2回答

Python pandas -检测numpy.ndarray列并将其转换为列表列

python、pandas、numpy

我们的pandas数据帧中有以下数据类型： >>> results_df.dtypes _id int64 playerId int64 leagueId int64 firstName object lastName object fullName object shortName

浏览 15提问于2020-11-29得票数 0

回答已采纳

2回答

如何在列的数据类型将是字典的情况下创建pandas数据框架？

python、pandas

有没有办法创建一个由两列组成的pandas数据帧？第一列的数据类型是int，第二列的数据类型是字典。然后迭代地将数据插入到数据帧中。

浏览 0提问于2018-07-29得票数 0

3回答

如何从pandas的字典列中提取值？

python、pandas

我在每个列{'value'：2343}中都有一个包含字典的数据帧。我试图去掉字典，并将单元格设置为等于数据帧中所有字典的值。 import pandas as pd df = pd.DataFrame([ {'node': 'A', 'read': {'value': 2343}, 'write': {'value': 23}}, {'node': 'B', 'read': {'value': 334}

浏览 64提问于2019-08-23得票数 0

回答已采纳

1回答

识别为对象而不是数值的Pandas数据框数据类型

python

我看了看数据，它看起来像是数字？我写了一个小循环，它显示像84这样的值不是整型，或者214.56不是浮点型。它看起来就像坏了一样。Pandas数据帧对它们来说只是随机性吗？我的数据集是这样的： (622380，45) 当我隔离列时，它仍然有问题。但是，当我缩短这一列时，它似乎是可以的。是否存在数据帧变得不稳定的长度？我可以强制使用数据类型吗？

浏览 11提问于2019-03-25得票数 0

1回答

在Dataframe中应用lambda函数获取数据类型

python、pandas

我想使用lambda函数来获取pandas数据文件中列的数据类型。假设我的数据是df。我写了以下代码 df.apply(lambda x: x.dtype) 因此，如果df有数字列，则此命令应返回这些列的'int64'。但是，当我运行我所拥有的一个dataframe的代码时，我只看到object作为类型返回。为什么会有这种行为？

浏览 1提问于2016-08-29得票数 0

2回答

我如何循环工作空间中的所有Pandas数据帧？

python、pandas、dataframe

我希望能够迭代所有数据帧(而不是名称！)当前在工作区中的。为了获得所有数据帧的列表，我找到了以下解决方案 import pandas as pd # create dummy dataframes df1 = pd.DataFrame({'Col1' : list(range(100))}) df2 = pd.DataFrame({'Col1' : list(range(100))}) # check whether all variables in scope are pandas dataframe. # Dir() will return a li

浏览 3提问于2020-08-08得票数 0

回答已采纳

2回答

如何从混合类型Pandas dataframe列中删除带有小数点的行

pandas

我想知道如何从Pandas数据帧中混合类型的列中删除带有小数点的行。假设我有一个混合类型的列(类型'o')。 d = {'col1': [1, 2.3, 'Level1']} test1 = pd.DataFrame(data=d) test1['col1'].dtypes dtype('O') test1 col1 0 1 1 2.3 2 Level1 我想删除包含小数点的行。 test1 col1 0 1 2 Level1 我尝试了str.isdecimal()或str

浏览 6提问于2022-03-02得票数 0

1回答

如何在pandas dataframe中创建布尔型空列？

python、pandas、boolean

我想向给定的pandas数据帧添加一个空的布尔列。现在我已经这样做了(df是我的数据帧)： <code>A0</code> 然后，我的专栏如下所示： <code>A1</code> 这并不表示某些值可能丢失，并且该列实际上是空的。在pandas数据帧中获取boolean类型的空列是不可能的吗？

浏览 9提问于2019-03-28得票数 4

2回答

python:删除pandas dataframe中包含字符串的所有行

python、pandas、dataframe

我有一个名为data的pandas数据帧，我想删除任何列中包含字符串的所有行。例如，下面我们看到'gdp‘列在索引3处有一个字符串，'cap’列在索引1处。 data = y gdp cap 0 1 2 5 1 2 3 ab 2 8 7 2 3 3 bc 7 4 6 7 7 5 4 8 3 ... 我一直在尝试使用类似这个脚本的东西，因为我不会提前知道exp_list中包含了什么。不幸的是，"data.var_name“抛出了这个错误：'DataFrame

浏览 0提问于2013-11-08得票数 14

回答已采纳

1回答

获取pandas中可用数据帧的列表

python、pandas

如何检查pandas中可用数据帧的名称？通过一个循环，我创建了几个数据帧，并且我想检查是否创建了所有需要的df

浏览 0提问于2017-03-21得票数 1

1回答

pandas.read_sql将数组列直接读入本机结构？

pandas

有没有办法让pandas将包含数组类型的列的表直接读入本机结构？默认情况下，int[]列作为对象列结束，其中包含python int的python列表。有一种方法是将这个到一个系列的列中，或者更好的是，一个具有多个索引的列，但是这对于500M的行来说是非常慢的(大约10秒)。如果数据最初加载到数据帧中，速度会快得多。我不知道如何在sql中展开数组，因为我有很多数组列。 url = "postgresql://u:p@host:5432/dname" engine = sqlalchemy.create_engine(url) df = pd.read_sql_query(&#

浏览 5提问于2017-07-07得票数 1

3回答

Pandas在使用read_csv时添加小数点

python、pandas、csv

我正在处理一些csv文件，并使用pandas将它们转换为数据帧。之后，我使用一个输入来查找要删除的值我遇到了一个小问题:对于某些列，它会将".o“添加到列中的值中。它只在包含数字的列中执行此操作，所以我猜它将该列读取为一个浮点数。如何防止这种情况发生？真正让我困惑的是，它只发生在几个列中，所以我不能完全弄清楚模式。我需要去掉".0“，这样我才能重新导入它，而且我觉得从一开始就防止它发生是最容易的。谢谢! 下面是我的代码示例： clientid = int(input('What client ID needs to be deleted?')) df1

浏览 134提问于2019-01-11得票数 2

1回答

Pandas的`read_sql`在从包含带小数点的数字列的Oracle表读取数据时创建整数列

python、pandas、oracle、read-sql

我有一个Oracle表，其中包含类型为VARCHAR2 (即字符串)和类型为NUMBER (即带有小数部分的数值)的列。并且数值列实际上包含带有小数点的值，而不是整数值。但是，当我通过pandas.read_sql将这个表读入Pandas数据帧时，我收到的数据帧中的数字列是int64。如何避免这种情况，并接收包含完整十进制值的float列？我正在使用以下版本 python : 3.7.4.final.0 pandas : 1.0.3 Oracle : 18c Enterprise Edition / Version 18.9.0.

浏览 3提问于2020-05-28得票数 2

2回答

Pandas惯用的将json列表映射到dataframe的方式

python、json、pandas

我有一个从json输入派生的数据集，我希望将其映射到pandas dataframe。假设对应于表的各个行的json如下所示： popo = {'foo': 3.14, 'bar': [1, 2, 3]} 也就是说，与我的表中所需列之一对应的键本身是一个固定长度的列表。使用pandas.DataFrame.from_dict或pandas.io.json.json_normalize加载这类字典的列表，会产生一个包含两列的数据帧: foo和bar。在这两种情况下，bar都是object类型，这些对象是python列表。 df = pd.DataFrame.f

浏览 46提问于2019-03-04得票数 2

2回答

在pandas中读取行并将浮点数转换为整数

python、pandas、dataframe

我有一个包含多行和多列的数据帧。我的一列(让我们称其为A列)包含混合了字符串、字符串和整数(即RSE1023)、仅整数和仅浮点数的行。我想找到一种方法来将A列中浮点数的行转换为整数。可能是通过某种方式扫描数据帧中的列，找到属于列的行并使其成为整数？

浏览 0提问于2020-04-02得票数 0

3回答

将Pandas中的变体类型插入Snowflake

python、pandas、snowflake-cloud-data-platform

我正在尝试将来自Pandas dataframe的数据插入到Snowflake中的一个表中，但我在找出如何正确执行此操作时遇到了麻烦。首先，我在Snowflake中创建了一个表，其中包含一些VARIANT类型的列。例如： CREATE OR REPLACE TABLE mydatabase.myschema.results( DATE date, PRODUCT string, PRODUCT_DETAILS variant, ANALYSIS_META variant, PRICE float )

浏览 0提问于2020-11-06得票数 4

2回答

检查pandas dataframe列中的字符串类型

python、string、pandas

我有一个相当大的熊猫数据帧(11k行和20列)。一列有一种混合数据类型，主要是数字(浮点型)，其中有一些分散在各处的字符串。在使用mixed列中的数据执行统计分析之前，我通过查询其他列来设置此数据帧的子集(但如果存在字符串，则无法执行此操作)。一旦对该列进行子集，99%的时间都是纯数字的，但很少有字符串值会出现在子集中，我需要捕获子集。循环遍历Pandas混合类型列以检查字符串(或者相反地检查整个列是否充满数值)的最有效/pythonic方法是什么？如果列中只有一个字符串，我想引发一个错误，否则继续。

浏览 0提问于2018-03-07得票数 3

1回答

如果数据类型错误，如何跳过加载到Pandas数据帧的excel文件的行(检查类型)

python、python-3.x、pandas、dataframe

我刚刚编写了以下代码： import os import pandas as pd files = os.listdir(path) #AllData = pd.DataFrame() for f in files: info = pd.read_excel(f, "File") info.fillna(0) try: info['Country'] = info['Country'].astype('str') except ValueError: cont

浏览 1提问于2021-05-06得票数 2

1回答

在Python语言中从Spark DataFrame创建labeledPoints

python、pandas、apache-spark、apache-spark-mllib、apache-spark-ml

我应该使用python中的哪个.map()函数从spark数据帧创建一组labeledPoints？如果标签/结果不是第一列，但我可以引用它的列名'status‘，那么表示法是什么？我使用这个.map()函数创建Python dataframe： def parsePoint(line): listmp = list(line.split('\t')) dataframe = pd.DataFrame(pd.get_dummies(listmp[1:]).sum()).transpose() dataframe.insert(0, 's

浏览 3提问于2015-09-14得票数 14

回答已采纳

2回答

识别pandas read_sql中的日期类型

python、sql-server、python-3.x、pandas

在pandas中使用read_sql时，该函数需要确定哪些列应该被视为日期(参见下面的代码片段)。但是我事先不知道哪些栏是日期。给定一条select语句，我需要检索它的列类型并将结果集加载到pandas数据帧中。我期望pandas在从select创建dataframe时标识date类型的列并分配类型。在select语句或数据帧中标识date类型的最佳方法是什么？我尽量避免使用pyodbc运行语句来检测类型。 import pyodbc import pandas as pd conn = pyodbc.connect.... sql_df = pd.read_sql( &#

浏览 60提问于2020-10-03得票数 1

1回答

这是在python中测试pandas数据帧的正确方式吗？

python、python-3.x、pandas、dataframe、python-unittest

我有一个函数，它返回一个包含行和列的数据帧。下面是函数: app.py def pandas_factory(colnames, rows): return pd.DataFrame(rows, columns=colnames) 下面是我的单元测试用例: test_app.py def test_panda_fact(self): from dlp.dlp import pandas_factory df1 = pd.DataFrame({'a': [1, 2], 'b': [3, 4]}) w

浏览 4提问于2020-10-23得票数 0

回答已采纳

1回答

潘达斯DataFrame的匹配器

python、testing、numpy、pandas

我正在寻找一个坚实的例子，为熊猫DataFrame匹配。我感到惊讶的是，我还没有找到合适的东西。我的对手有以下要求：比较两个数据帧是否相同，给出忽略列顺序的选项，并给出可接受的公差级别(四舍五入)。描述发生标准DataFrame匹配器的不匹配情况。我查看了pandas.util.testing的pandas.util.testing，发现的博客文章很有帮助，但是定制的matcher仍然很差，并且在比较不同索引的DataFrames时也有错误。

浏览 3提问于2015-04-09得票数 0

5回答

使用Python infix语法将输出从一个函数“管道”传输到另一个函数

python、pipeline、infix-notation

我正在尝试使用Python/Pandas粗略地复制R中的包(作为学习练习)。我所坚持的是“管道”功能。在R/dplyr中，这是使用管道操作符%>%完成的，其中x %>% f(y)等同于f(x, y)。如果可能的话，我想使用中缀语法来复制(参见)。为了说明这一点，请考虑以下两个函数。 import pandas as pd def select(df, *args): cols = [x for x in args] df = df[cols] return df def rename(df, **kwargs): for name, valu

浏览 206提问于2015-11-12得票数 30

回答已采纳

1回答

如何在一定条件下过滤pandas数据框中的列值？

python、pandas

我创建了一个Pandas数据帧，并希望筛选出一些值。数据帧包含4列，即currency port supplier_id value，并且我希望具有能够满足下面提供的条件的值， * port – expressed as a portcode, a 5-letter string uniquely identifying a port. Portcodes consist of 2-letter country code and 3-letter city code. * supplier_id - integer, uniquely identifying the provider

浏览 0提问于2017-03-07得票数 1

回答已采纳

2回答

带有二进制列的spark写入csv文件

dataframe、csv、apache-spark、apache-spark-sql

我们有包含二进制列的数据帧，当我们将数据帧保存为csv时，二进制列将导致csv解析器出现问题。有没有办法强制spark csv write写出hex或base64编码字符串中的任何二进制列？

浏览 24提问于2021-02-10得票数 0

回答已采纳

1回答

在Pandas行中为非float64类型的列创建null /NaN值

python、python-3.x、pandas

上一次我尝试将nan放入Pandas数据帧中时，它迫使我将列类型从int改为float。据我所知，在SQL中，任何类型的列中都没有'NULL‘的问题。我正在处理的数据帧经常进出SQL。现在我有了一个包含int、object和float列的数据帧，需要创建一些代码来编程添加一些单行，其中7列中的6列应该不包含任何内容，并且7列中只有1列被赋值。在Pandas中，有没有其他标准的'NULL‘东西可以放在不是float类型的列中？这一次，我肯定不能仅仅为了在其中放入一个nan而改变列的类型。

浏览 6提问于2018-02-28得票数 0

1回答

检查列是否为矢量类型

pyspark

我正在尝试确定列是否为向量类型，但遇到了问题。在我运行了一个模型并创建了一个名为predictions的数据帧之后，有一个名为probability的字段。当我运行这段代码来查看数据类型时，if显示了一个向量。 predictions.schema['probability'].dataType Out[128]: VectorUDT 然后，当我运行此命令时，我会得到一个false返回 predictions.schema["probability"].dataType == 'VectorUDT' Out[129]: False 所以我试

浏览 28提问于2021-09-24得票数 2

回答已采纳

1回答

Python :只能比较相同标记的ValueError对象

python、pandas

我看到了关于这个的堆叠流帖子，但是没有任何东西与我的需求相匹配，所以我创建了这个帖子。我正在使用python 3.6。我有一个数据框架，df_student.The示例数据如下所示我试图使用以下代码过滤数据帧 df_filter1=df_student.loc[(df_student['year'] == x & (df_student['Grade']==y) & (df_student['Mail']==z)] x，y&z是从代码中生成的，很抱歉我无法共享代码。但是在运行这个之后，我得到了错误消息。 Value

浏览 4提问于2018-01-04得票数 0

回答已采纳

3回答

Pandas获取加载到内存中的所有数据帧的列表

python、pandas

我正在使用pandas将几个csv文件读取到内存中进行处理，并在某一时刻列出我加载到内存中的所有数据帧。有没有简单的方法可以做到这一点？(我正在考虑类似%ls的内容，但仅限于内存中可用的数据帧)

浏览 4提问于2016-12-13得票数 18

回答已采纳

2回答

为什么dataframe对象要转换为TimeSeries对象

python、pandas、dataframe

假设我有一个数据框架。有多个列(例如：‘，'B')使用以下代码，我希望仅基于一列就生成一个新的数据格式： df2 = df1['A'] 但是，当我这样做时，数据帧突然被转换为TimeSeries。 In [5] print type (df2)<class 'pandas.core.series.Series'> 非常odd...can有人向我解释为什么会发生这种事.？

浏览 3提问于2015-12-14得票数 0

回答已采纳

2回答

从熊猫数据中的特定列中获取非浮点数

python、pandas、dataframe

我想在一个新的dataframe中获取原始数据的行，其中在特定列中有一个非实值(即字符串)。 import pandas as pd import numpy as np test = {'a':[1,2,3], 'b':[4,5,'x'], 'c':['f','g','h']} df_test = pd.DataFrame(test) print(df_test) 我想得到第三行，其中'b‘列中的值不是数字(它是'x')。

浏览 5提问于2022-12-02得票数 -1

2回答

从python列表中移除包含特殊字符的元素

python、list

我有一个python列表，其中每一行索引表示一个值列表。在某些情况下，行值包含特殊字符。在行中的任何列表元素包含特殊字符的情况下，我希望从列表中删除整行。注意，我希望在不将列表转换为NumPy数组或pandas数据帧的情况下完成此操作。我正在考虑检查包含特殊字符的行索引，然后以这种方式删除它们，但不确定如何使用python列表来完成此操作。另一种选择是转换为NumPy数组，进行数据清理，然后转换回原始列表格式，但保持原始结构。 testList = [[30.0, '?', 910.0, 120.],[11.0, 25.4, 330.3, 340.0], [1.6, 23.4

浏览 132提问于2021-01-20得票数 0

回答已采纳

2回答

如何在不占用RAM的情况下创建额外的列，然后将其用于ML算法？

python、pandas、machine-learning、dask、ram

我有一个包含3m+ (有序)行和100列的数据集，我可以使用Pandas将其加载到我的笔记本中。我想追加大约900列，这些列是使用100个现有的列计算得出的。最终目标是训练几个机器学习模型(NN，随机森林)。当我尝试使用Pandas添加列时，由于RAM不足(我有25 to )，我的机器崩溃了。因此，我尝试使用Dask，它允许我毫无问题地计算900列。然而，Dask数据帧不能用作随机森林(Sklearn)和Keras模型的输入，所以我猜在某些时候您必须将其转换回pandas数据帧。在这一点上我被卡住了。速度是相当重要的，因为我需要经常改装模型。有没有人有好的建议？

浏览 18提问于2021-05-22得票数 1

1回答

在一列(时间戳和字符串)中，将数据帧存储为具有混合数据类型的块。

python、pandas、parquet、pyarrow

我想存储一个熊猫数据帧作为Parquet文件。但我发现了一个错误： pyarrow.lib.ArrowTypeError：(“不能将<class 'str'>类型的对象转换为int"，”类型对象的列foo转换失败“) 该列具有混合数据类型。我想这就是问题所在。但我该怎么解决呢？ #!/usr/bin/env python3 import pandas df = pandas.DataFrame( data={ 'foo': [pandas.Timestamp('2022-06-01'), '

浏览 2提问于2022-06-29得票数 -1

2回答

如何更改python中所有列的数据类型

python、pandas

我使用的是pandas数据帧。数据包含3032列。所有列都是'object‘数据类型。如何将所有列转换为“float”数据类型？ ? ?

浏览 30提问于2020-12-01得票数 1

回答已采纳

2回答

将数据帧写入SQL的函数

python、sql、pandas

我有一个函数，它接收数据帧并将其作为表写入SQL。 def insert(df): with connection.cursor as cur: cur.execute('''create tablaexyz.xyz (ID integer, first_name varchar(100), last_name varchar(100))''') d

浏览 17提问于2021-04-07得票数 0

1回答

Python:将df中的行数添加到另一个df中作为新列

python、pandas、dataframe、rows、shape

假设我计算了熊猫数据帧中的行数。我使用以下代码来完成此操作： df.shape 它给出了以下结果：(1700，12) 如何将1700值添加到现有的pandas数据帧中？我们将把与该值相关联的列称为D。当前数据帧： A B C 30 40 text 所需数据帧： A B C D 30 40 text 1700

浏览 2提问于2018-04-18得票数 0

2回答

编写一个结构列和int/string列都很少的spark dataframe？

postgresql、pyspark、apache-spark-sql

例如，考虑下面的数据帧- ? 我想把这段代码写到Postgres，末尾的表应该包含所有列，而不是一个字符串化的一列。我不能在这个级别分解多个数组(业务逻辑)。

浏览 12提问于2020-03-28得票数 0

3回答

如何将熊猫数据框架中的正误映射为“是”和“否”，只对dtype bool列进行映射？

python、pandas、dataframe、replace、boolean

我有一个pandas数据框架(v0.20.3)： df = pd.DataFrame({'coname1': ['Apple','Yahoo'], 'coname2':['Apple', 'Google']}) df['eq'] = df.apply(lambda row: row['coname1'] == row['coname2'], axis=1).astype(bool) coname1 coname2 eq 0 App

浏览 4提问于2017-07-19得票数 11

回答已采纳

1回答

如何检查模式包含的是字符串数组还是pyspark中的结构数组

python、pyspark、apache-spark-sql

浏览 9提问于2021-08-02得票数 1

回答已采纳

2回答

在追加两个pandas数据帧时，布尔值将转换为浮点数

python、pandas、dataframe、append

当其中一个数据帧的列全部为空值(NaN)，而另一个数据帧在同一列中具有布尔值时，追加两个pandas数据帧具有意外的行为。结果(通过追加)数据帧中的相应列被类型化为float64，并且布尔值根据它们的原始布尔值被转换为1和0。示例： df1 = pd.DataFrame(data = [[1, 2 ,True], [10, 20, True]], columns=['a', 'b', 'c']) df1 a b c 0 1 2 True 1 10 20 False df2 = pd.DataFrame

浏览 30提问于2019-11-13得票数 2

回答已采纳

1回答

字符串(对象)数据的to_sql内存不足错误

python、sql、pandas、dataframe

我正在使用to_sql将pandas数据帧写入SQL server数据库。数据帧很小(1列，100行)。然而，我得到了一个错误： cursor.executemany(statement, parameters) MemoryError 该列的dataType为object (即string)。如果我将dataType转换为INT，则代码执行时不会出现错误。为什么对象数据会导致内存不足错误?我如何修复它？

浏览 3提问于2020-09-19得票数 0

2回答

删除字段中字符串长度过长的行

python、pandas、jupyter

我想用pandas在数据帧中的列中消除字段中过长的字符串，例如： email,name,user test1@hotmail.com,joe,4321 test1.test2.test3._4567865433_testqwerty@gmail.com,rey,9876 test-_2@aol.com,loy,6543 简而言之，在这种情况下，删除包含过长电子邮件的字段 email,name,user test1@hotmail.com,joe,4321 test-_2@aol.com,loy,6543 你知道做这事的捷径吗？删除整行谢谢！

浏览 105提问于2021-08-09得票数 0

回答已采纳