pandas，如何将任何包含单词的列转换为数字(即映射它们)？ - 腾讯云开发者社区

python、json、pandas

我有一个CSV文件，其中有两列，一列用于法语单词，一列用于英文单词： French,English partie,part histoire,history chercher,search seulement,only police,police 我试图将CSV数据更改为JSON，但遇到了一个错误。我的索引，我想成为一个整数，似乎是一个字符串。也尝试使用int()，但是看起来它不会修复这个问题。如何将JSON文件中的索引值更改为整数？ import json import pandas data = pandas.read_csv("data/french_words.csv"

浏览 10提问于2022-08-20得票数 1

1回答

pandas数据帧行使用sklearn进行缩放

python、python-3.x、dataframe、scikit-learn

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

1回答

将单词(仅为字母)和包含数字的单词提取到单独的数据栏中。

python、pandas、dataframe

我试图将只包含字母的单词提取到新的列中，任何包含数字的单词都提取到不同的列中。期望输出： query words_only contains_number 0 Nike Air Max 97 Nike Air Max 97 1 Adidas NMD-R1 Adidas NMD-R1 2 Nike Air Max 270 Nike Air Max 270 我尝试过的：我在这里看到了一些答案，但这并不完全是我所需要的。最小可重现性示例： # Import p

浏览 10提问于2022-11-18得票数 0

回答已采纳

2回答

如何为以下内容实现散列

java、algorithm、hash、hashtable

我正在尝试编写一个Java程序，它使用散列来解决以下问题。给定一个自然语言文本，生成一个不同的单词列表，其中包含每个单词在文本中出现的次数。在程序中插入适当的计数器，将散列的经验效率与相应的理论结果进行比较。我了解哈希和哈希表的基本原理，但我不知道如何将其应用到计算机程序中。我的课本没有给出任何例子，我的教授也从来没有在我的课堂上复习过任何具体的例子。我相信程序应该首先扫描文件中的文本，但我不知道在那之后该去哪里。谢谢你的帮助。

浏览 0提问于2012-11-16得票数 0

回答已采纳

2回答

Python pandas groupby by字典

python、dictionary、pandas-groupby

我有以下问题。在pandas数据框中，我有一列包含所有完整的单词和缩写。第二列带有一些浮点数。极性crypto_match_1 我想通过字典对这些列的单词和缩写进行groupby()。但是，该函数将单词和缩写分开分组。 crypto_ranking = dataframe_crypto.set_index('crypto_match_1').groupby(by=new_dict,axis=0).mean().reset_index()

浏览 1提问于2018-02-12得票数 0

2回答

如何将包含字符串值的pandas数据帧的列转换为int/float？

python、pandas、svm

我有一个pandas dataframe，它包含一个非数字值的列。如何将它们转换为整型/浮点型。 eq： Col1 Col2 Lip_GD 267 Gly_hy_68 467 Hint_2 628 Jac+Jac 339 Lip_GD 234 Jac+Jac 267 当我将这些数据读入pandas数据帧时，我将如何将列1转换为int？

浏览 4提问于2015-11-26得票数 3

1回答

在Excel中使用Python实现多列的多对一映射

python-3.x、openpyxl、xlsxwriter

在Excel中，我有一个类似下面的映射表，其中列B-L分别包含来自两个单独数据集的列标题的名称，需要将这些名称映射到由两个单独的数据集组成的新的串联数据集中的列A中的新列标题。 A B C D E F G H I J K L Ant Car Bin Bat Bat Gat Rat Mat Sat Pat Fat Cat Hat 在上面的示例中，来自数据集1(列B)的Bat需要映射到新的级联数据集(列A)中的Bat，并且来自数据集2的列E-L中的列

浏览 45提问于2020-10-15得票数 0

2回答

如何检查单元格中是否存在作为子字符串/子字符串的关键字列表？并报告匹配的子字符串。

excel

如果Excel单元格包含单独列中的单词或单词，请如何搜索？如果存在子字符串，则显示匹配的子字符串是什么。如果满足第二个子字符串，则在下一列中显示。例如带有原始数据的A列有以下几行： There is a dog A Cat is happy Cat and dog are both animals Elephant is big Happy cAt, dOg, fox, MOUSE Elephant are good Hello dogelephantMOouse Hello Hello 列B包含以下按顺序排列的键(按重要性的递减顺序)： Row 1: dog Row 2: cat Row

浏览 1提问于2022-10-20得票数 2

回答已采纳

1回答

将标点符号替换为文本中的空格

python、regex、pandas、dataframe

我有一个像这样的文本，Cat In A Tea Cup by New Yorker cover artist Gurbuz Dogan Eksioglu,Handsome cello wrapped hard magnet, Ideal for home or office.我用下面的代码删除了这个文本中的标点符号。 import string string.punctuation def remove_punctuation(text): punctuationfree="".join([i for i in text if i not in string.punc

浏览 63提问于2021-07-30得票数 1

回答已采纳

2回答

如何将元素列作为一行保存在csv文件中？

python、pandas、dataframe、csv、export-to-csv

如何将元素列保存为CSV文件中的行/列表？下面是我代码的相关部分..。 import pandas as pd df=pd.DataFrame(tbl,columns=['type','skill','job1','job2','m1','m2']) df2=df['skill'] print(type(df2)) print(df2) ...and的相应结果. <class 'pandas.core.series.Series'> 1

浏览 2提问于2022-09-27得票数 0

回答已采纳

1回答

如何在此数组公式中返回列号

excel、excel-2007

我有一个数组公式： ={SUM(IF(ISERROR(SEARCH(Source!K2:L13,F2)),0,1))} 这个公式只是在F2中的一个短语中查找来自K2:L3的所有可能的单词匹配。它返回在F2中找到的单词数之和。我需要做的是返回第一个范围的列，其中包含在F2中找到的一个单词。例如，我在F2 Hello上有一个短语，你好吗？我有一个词 on let say K2，我如何返回K2的列号，它是11？任何帮助都是非常感谢的。

浏览 3提问于2013-10-23得票数 0

回答已采纳

1回答

如何将word的向量传递给LSTM？

lstm、word2vec

我正在使用LSTM进行情绪分析，我有一个csv格式的数据集，其中有' sentiment '，'Tweet‘。Wor2vec模型是在这个数据集上训练的，但是现在我不知道如何将它作为输入提供给lstm。我试着用矢量替换csv文件中的单词，但我做不到。在构建lstm时是否需要使用任何查找方法，或者我们必须用向量替换csv文件中的单词，但如何做呢？ (我已经保存了经过训练的word2vec模型)

浏览 1提问于2018-05-12得票数 0

1回答

在python中将自定义字符串格式的时间戳列转换为秒

python、pandas、string、datetime

我有一个pandas dataframe，它有多个列，其中包含字符串格式的时间戳值。这些值类似于'0D_0H_1M_35S_0MS‘。我想将所有这些列值转换为毫秒 ?

浏览 23提问于2020-12-04得票数 1

回答已采纳

1回答

PHP中的Excel自定义时间格式解码

php、excel、timestamp

我在PHP中处理了大量的电子表格，其中一个单元格包含一个时间戳，该时间戳具有自定义格式：[h]:mm:ss.0;@ 这会将2.09491E-05之类的数字转换为0:00:01.8 当我将其读入php时，我只能得到2.09491E-05的值，但我不知道如何将其转换为秒。有人能帮上忙吗？

浏览 3提问于2013-01-12得票数 0

回答已采纳

1回答

如何将这些字符转换为其可读形式

oracle

我的oracle数据库表中有一些列，其中包含一些��。如何将其解码为其原始的可读形式。我知道这与编码有关，但我需要找到一个解决方案。在我的php应用程序中，这些字符是简单的'??‘。我正在使用sql developer查看记录。

浏览 1提问于2013-04-18得票数 1

1回答

将一行、列值转换为dict并转换为dataframe大熊猫。

python-3.x、pandas、dictionary、dataframe、series

这里是python noob。我有一个dataframe people，其中name和text作为两列。 name text 0 Obama Obama was the 44th president of the... 1 Trump Donald J. Trump ran as a republican... 我只需要对Obama进行一些探索性分析。 obama= people[people['name'] == 'Obama'].copy() obama.text 35817 Obama was the 44th

浏览 4提问于2016-11-18得票数 1

回答已采纳

4回答

斯坦福手套没有标点符号？

machine-learning、nlp、stanford-nlp

据我所知，通过注意频繁出现的内容来训练向量，等等，但是为什么逗号和句点不包括在内？对于任何NLP来说，拥有一个向量表示似乎都是一个重要的特性。我知道像(king - man = queen)这样的东西对(word -，= ?)没有任何意义，但是有没有一种方法来表示标点符号和数字呢？有没有包含这些东西的预制数据集？这能行得通吗？我尝试用我自己的数据集训练GloVe，但我遇到了在单词之间分隔标点符号(用空格)等问题。

浏览 0提问于2015-07-30得票数 3

2回答

python中将对象数据类型转换为数字和类别

python、pandas

因此，我有一个包含不同数据类型的列的csv。但是当我将它读入pandas时，它将所有内容都显示为object数据类型。如何将列转换为原始的数字和分类特征？

浏览 23提问于2019-09-24得票数 0

10回答

如何将Pandas数据框中的字符串转换为“date”数据类型？

python、date、pandas

我有一个熊猫数据框，其中一列包含YYYY-MM-DD格式的日期字符串例如，'2013-10-28' 目前，该列的dtype是object。如何将列值转换为Pandas日期格式？

浏览 2提问于2013-05-31得票数 128

回答已采纳

1回答

导致浮点数出现的Pandas.to_csv

python、pandas、export-to-csv

我已经创建了一个程序，它接收Excel表格，用Pandas修改它们，并将它们保存到CSV中。当我检查输出CSV时，这些列被看作是ints，但是当我将这些列上传到Oracle时，这些列就会浮动。输入excel中的某些列是诸如"3“"4”"1“之类的东西，但其他列包含货币值的实际浮动值。因此，我不能将数据转换为as_type(int)。 excel工作表的编号为数百张，每个月都有不同的列名。因此，as_type(int)的列式应用程序将无法工作。代码示例： import pandas as pd output_location = save_location + &#

浏览 2提问于2020-03-04得票数 0

回答已采纳

1回答

将一系列数字转换为R中的日期

r、rstudio

我有一个读取到R上的.xlsx文件，这个文件有一个日期格式(d/m/y)的列，但由于某些原因，它在RStudio上的数据框中显示为一系列数字。我的问题是如何将列更改为原始日期格式？这是一个显示日期的例子：887587200 -而不是像12/03/1974这样的东西。任何帮助解决这个问题的人都将不胜感激。谢谢

浏览 7提问于2016-08-12得票数 1

回答已采纳

1回答

在字符串中查找子字符串

python、pandas

我有一个包含列' status‘的dataframe，如果status的值包含单词"Won“，我会将status列的值替换为1，否则将替换为0 我试着这样做： s = oppty_oppline['status'] if s.find("Won") == -1: oppty_oppline['status']=0 else: oppty_oppline['status']=1 但是我得到了这个错误： AttributeError

浏览 15提问于2019-03-11得票数 1

回答已采纳

2回答

如何将专门找到的(OCR)文本添加到列表中并将其写入excel文件？[pytesseract]

python、machine-learning、ocr

我想通过pytesseract从许多PNG/JPEG文件中提取某些信息，如果可能的话，将它们写入excel文件。我已经知道了如何从图片中提取文本，但我还没有弄清楚的是： 1)如何提取特定信息而不是整个单词？例如，我想要每张照片的账号和参考号码，其他什么都不要。 2)如何将这些账号和参考号写入excel等外部文件？我将把我目前掌握的内容附加到下面：我听说使用pandas dataframe是将数据追加到Excel列中的好方法，但我不确定对于这样的任务是否可以做到这一点。 from PIL import Image import pytesseract import pandas as p

浏览 47提问于2019-02-11得票数 0

2回答

将不同Dataframes的列表保存到json

python、json

我有不同的熊猫资料，我把它们列在一张清单上。我想用json (或任何其他格式)保存这个列表，这些列表可以被R. import pandas as pd def create_df_predictions(extra_periods): """ make a empty df for predictions params: extra_periods = how many prediction in the future the user wants """ df = pd.DataFrame({ &#

浏览 3提问于2017-05-28得票数 4

回答已采纳

1回答

从URL创建名称

python、pandas

我正在DataFrame中创建一个NAME列，并根据另一列中包含的子字符串设置它的值。有没有更有效的方法来做到这一点？ import pandas as pd df = pd.DataFrame([['www.pandas.org','low'], ['www.python.org','high']], columns=['URL','speed']) print(df.head()) df['Name'] = df['URL'] print(df

浏览 0提问于2020-06-25得票数 3

回答已采纳

1回答

在pandas列的list和list之间匹配相似元素

python、python-3.x、pandas

我已经问过问题了。这个是修改后的形式，所以我把它作为新问题发布。我有一个L2=['marvel comics','bmw','mercedez benz','audi']的名单。我有一个列名称为words_col的pandas数据帧，它包含每个单元格中的元素列表，希望将列列表与list L2进行匹配，并将其放入新的列match_words中。如果它还包含任何匹配的单词，比如mercedez benz中的mercedez和marvel comics中的marvel，那么它应该返回元素。因此，最终输出将是。 words_col

浏览 0提问于2018-07-24得票数 3

2回答

Pandas:提取似乎具有浮点型变量的行的索引

python-3.x、dataframe

假设我有以下数据帧 import pandas as pd df = pd.DataFrame( {3: {0: 'Total shareholders’ equity, beginning balances', 1: 'Total shareholders’ equity, beginning balances', 2: 'Total shareholders’ equity, beginning balances', 3: '$', 4: '90488', 9: '$', 10: '1

浏览 19提问于2020-12-09得票数 0

回答已采纳

3回答

使用java构建字典

java、data-structures、dictionary

我正在用java语言编写一个字典类的应用程序，我有一个包含250万个单词的列表，在一个单词document.My字典中查找列表是基于移动application.So的，当用户键入4时，我应该得到以字母开头的单词，即ghi，如果我键入2，我应该取以ghi开头的字母，第二个字母是abc中的一个。现在应该遵循的方法是什么。1.根据空间和时间复杂度，应该使用什么数据结构来存储单词列表？ 2.我很困惑，因为如果我输入15个数字，几乎令人难以置信的组合，在所有的数字都是typed.So之后进行暴力检查，我应该取以开头的单词，包含这些。有人能给我指路吗？

浏览 0提问于2010-12-12得票数 0

回答已采纳

4回答

如何将法语单词转换为整数？

python、french

有关将英语单词转换为数字的其他问题已经得到回答，特别是使用库或其他自定义算法。但是，我不知道如何将法语(或泛指任何语言的)单词转换为整数，例如： >>> word_to_number('quarante-quatre') 44 我不是一个会说法语的人，但这肯定不仅仅是在翻译中的单词，对吗？

浏览 3提问于2019-10-03得票数 3

回答已采纳

2回答

浮点数转换为从.dat文件读取的符号。不确定编码

python、pandas、encoding、xlwings

我正在尝试使用Python将MapInfo .dat文件读取到.csv文件中。到目前为止，我已经找到了最简单的方法是通过xlwing和pandas。当我这样做时(下面的代码)，我得到了一个基本正确的.csv文件。唯一的问题是，一些列显示为符号/胡言乱语，而不是它们的实际值。我知道这一点，因为我手头也有从MapInfo导出的正确数据。 import xlwings as xw import pandas as pd app = xw.App(visible=False) tracker = app.books.open('./cable.dat') last_row =

浏览 2提问于2020-11-20得票数 1

1回答

Python :如何在将数据导出到Excel时指定起始单元格位置

python、pandas、xlsxwriter

使用xlsxwriter将数据从Pandas导出到Excel时，默认情况下它似乎将表放在单元格A1中。有办法改变这种状况吗？我不介意插入行和列来将表从A1中移开，只要它是通过熊猫或xlsxwriter编程完成的。如果有帮助，这是我的代码。 writer = pd.ExcelWriter(r'c:\file.xlsx', engine = 'xlsxwriter') workbook - writer.book df.to_excel(writer, index=True, sheet_name ='Sheet1') 我也找不到任何插入行和列的

浏览 1提问于2016-04-30得票数 5

回答已采纳

1回答

使用CPU地址总线的数据交集

cpu、intersection、bus、address-bus

我正在读一篇论文，在这篇文章的一部分中有一个关于使用地址总线的相交集的注释。以下是该报的准确引文：快速检索方法通常依赖于包含特定单词或功能的交叉文档集。语义散列也不例外。分配给文档的代码中的每个二进制值表示一个集合，其中包含了整个文档集合的大约一半。如果用显式列表表示这些集的相交速度会很慢，但是所有计算机都有一种特殊的硬件--地址总线--可以在一台机器指令中相交集。语义散列只是将文档检索所需的集合交叉点直接映射到可用硬件的一种方法。我对cpu架构有一些基本的了解。我所需要的只是一个抽象的解释来理解这个操作是如何完成的。这篇论文是关于集合的，但我的问题是一般性的(任何数据)。

浏览 8提问于2012-05-18得票数 0

3回答

Spark TF-IDF从散列中取回单词

java、hash、apache-spark、tf-idf

我遵循Spark文档中的来计算一系列文档的TF-IDF。Spark使用散列技巧进行此计算，因此在最后你会得到一个包含散列单词和相应权重的Vector，但是...我怎样才能从散列中取回单词？我真的需要对所有的单词进行散列，并将它们保存在映射中，以便稍后迭代查找关键字吗？有没有更有效的方式内置Spark？提前感谢

浏览 0提问于2014-11-10得票数 5

2回答

Python文本相似性和匹配-当术语组合在一起时增加权重

python、pandas、text、similarity、textmatching

我在pandas中有两列，其中包含一系列术语，我的目标是从B列中找到与A列中的条目最匹配的条目。我使用TF-IDF来查找这两列之间的相似性，但这样做的问题是它会查找单个单词的出现情况，而不会对组合在一起的单词给予任何优先级。例如：“猫坐在席子上”应该更多地与短语“坐在席子上”的词条相匹配，而不是与“猫马坐狗在大象猪席上”的词条相匹配。

浏览 3提问于2017-05-18得票数 1

1回答

在Excel中将四位数字更改为年份

excel、powerquery

我有一个正在处理的数据集。数据集有一个包含四位数字的列。(1960年，1961年，...2010) 我正在对Power Query中的数据集进行实验，我注意到Power Query不能将列识别为年份。每当我单击列标题并将格式更改为date时，数字都会更改为1905。因此，我尝试在Excel中打开它，并更改其中的格式。 a screenshot from Excel 首先，我尝试将格式更改为yyyy日期，但数字变为1905。我想也许excel可以将列的内容识别为文本，因此我尝试通过两种方式将文本转换为值(通过value()函数和将数字乘以1，然后将其复制粘贴为值)，但是每当我将格式更改为y

浏览 224提问于2021-11-08得票数 0

1回答

我正在尝试使用Python 2将数据框中的列字符串转换为浮点型

python、database、data-mining

我是数据分析的新手，正在寻找帮助。我正在使用python从头开始创建我的Knn算法。我需要将我的数据帧中的一列字符串转换为浮点数。我正在使用python 2。这是数据帧的外观。 sepal_length sepal_width petal_length petal_width CLASS_LABEL 0 6.1 2.9 4.7 1.4 versicolor 1 6.0 2.7 5.1 1.6 versicolor 2

浏览 17提问于2019-01-20得票数 1

回答已采纳

1回答

使用for循环将文本中的书面数字转换为总和

java

大家好，我正在完成一个在线练习，在这个练习中，我必须创建一个可以阅读几段文字的程序。所有数字(以文本形式书写)必须相加，并在末尾显示总和。我有几个问题，如果你们不介意回答，因为我已经研究了很多。这只是所用文本的一个示例：只要记住，你正站在12点的站台上，有五列火车在九条轨道上每小时运行一次。火车时速可达200英里。数十亿中的一员... 我使用的是StringTokenizer，所以每个单词都是单独读取的。通过研究，我学会了创建表示每个单词的数组(请参见代码示例)，这是为了让单词很容易表示为整数。虽然我也为每个数字创建了变量，但这并不是必需的，尽管我不理解Java如何表示单词的有效数字。

浏览 0提问于2013-06-29得票数 1

回答已采纳

1回答

Excel转置和链接同时进行

excel、excel-formula

我知道如何将单元格链接到另一个单元格，以使其内容更改为与源单元格匹配。我知道如何将行转置为列。有没有办法将行转置为具有动态调整以匹配其源的链接的列？

浏览 1提问于2016-04-26得票数 0

2回答

我们如何将不同的格式应用于数据帧中的不同列？

python、python-3.x、pandas、dataframe

我在这里看到了一个问题，关于将不同类型的格式应用于数据帧中的不同列。用户的解决方案如下所示。 format_dollar = "${0:.2f}".format format_percent = "{0:.2f}%".format df_agg[['YTD Open', 'REV2', 'Real_Profit']] = df_agg[['YTD Open', 'REV2', 'Real_Profit']].applymap(format_dollar) df_a

浏览 15提问于2021-01-27得票数 0

回答已采纳

3回答

基于字母创建数字向量

所以，这是一个问题： “创建一个给定一个单词的函数，返回单词的字母在字母向量上的位置。例如，如果单词是‘abba’，则函数将返回1 2 2 1。” 到目前为止，我得到的是： l <- function(word) { chr <- c() y <- c() strsplit(chr,word) i<-1 while(i<length) { o<-letters[i] x<-chr[i] if(o==x) {

浏览 0提问于2019-10-30得票数 2

2回答

Oracle:迁移列。包含值、空值和0

oracle、null、data-conversion

我正在将数据从一个数据库迁移到另一个数据库。我有一个数字列。它包含一些值，一些0和一些空值。我的直觉是将所有的0转换为NULLs。这将存储一个可选的、用户提供的号码。有没有理由不把所有的0都转换成NULLs？

浏览 0提问于2009-08-06得票数 0

1回答

交错data.frame的两列

我有一个这样的数据框架： GN SN a 0.1 b 0.2 c 0.3 d 0.4 e 0.4 f 0.5 我想要以下输出： GN a 0.1 b 0.2 c 0.3 有谁可以帮我？如何将第二列的元素“交错”到第一列的元素，以获得所需的输出？

浏览 1提问于2012-11-15得票数 1

回答已采纳

1回答

python pandas在写入csv时删除前导0

pandas、dataframe、export-to-csv

我正面临着一个可能与这个question和其他类似的问题相关的问题，我决定创建一个专家问题，因为我觉得我的问题可能有一些额外的东西需要考虑。这就是我现在面临的问题。我在pandas中有一个dataframe，它从sql读取数据，并显示如下内容： ? 在图片中，它向我展示了值具有前导'0‘，该列的数据类型是'object’。当我在我的windows机器(python 3.7，pandas 1.0.3)上运行这个SQL并导出到CSV时，它完全按照要求工作并显示正确的输出，当我尝试在我的Linux机器(python 3.5.2，pandas 0.24.2)上运行时出现问题，

浏览 128提问于2021-03-24得票数 0

4回答

Python --即使它存在于Pandas Dataframe中，也不能识别空值。

python、python-3.x、pandas

我正在读取一个csv文件，并在其中创建一个。它有许多不同数据类型的列。假设列"localHour“仅包含数值，但不幸的是它包含"null”值，因为它可以在Microsoft / Office应用程序中看到，甚至Pandas中的唯一()方法也显示它包含“空”值。 df1['localHour'].unique() Out[78]: array(['9', '12', '17', '16', '22', '19', '11', '15'

浏览 5提问于2017-12-13得票数 3

回答已采纳

1回答

尝试将对象列转换为int时出错

python、pandas

我有一个dataframe，其中没有几个列是对象，我希望将其中一个列转换为int列，这样我就可以使用它了。做些计算。但是，当你试图去做的时候，它就是得到了这个错误。这是我的密码。给了我错误的代码。 df['Amount in USD']=df['Amount in USD'].str.replace(',', '') #this worked fine df['Amount in USD']=df['Amount in USD'].astype(int) #but this doesn'

浏览 1提问于2021-02-07得票数 1

回答已采纳

1回答

KeyError:用Python轴绘制散点图时的“type”

python、pandas、matplotlib

我想用x和y轴画一个散点图，x轴分组。X轴将分为三种类型(例如h、o、c)，这些类型可由ID列标识。Y轴将有每个ID的平均值。以下是样本数据： id sum mean color type 0 109 2852 5.301115 r h 1 110 3162 5.877323 r h 2 111 1997 3.711896 b o Y轴为“平均值”列值，X轴为"id“值。当我在下面运行我的代码时，它会生成一个错误： File "pand

浏览 8提问于2017-08-22得票数 1

回答已采纳

2回答

如何更改python中所有列的数据类型

python、pandas

我使用的是pandas数据帧。数据包含3032列。所有列都是'object‘数据类型。如何将所有列转换为“float”数据类型？ ? ?

浏览 30提问于2020-12-01得票数 1

回答已采纳

1回答

如何在熊猫中创建列词作为行，并给出每个单词的权重和文件号

python、pandas、dataframe、numpy、matrix

我在Pandas库中查看了一个文件中的大量数据。该文件有三个重要列，一个列包含由数字表示的单词，一个列包含每个单词出现的文件号，一个列包含每个单词的权重。在包含文件号的列中，有许多用数字表示的重复单词。目的地：现在，我想要的是把单词列成一行，这样每个单词都在一列中，并放置文件号的列，以便单词出现在哪个文件号中，并将权重放在单词下面，如图片中所示：我试着使用transpose和csv库，试着把每个单词都放在单子列表中，但是我无法找到解决方案。因此，如果有任何解决办法与熊猫或其他图书馆告诉我，请。谢谢大家的帮助，我的经验不多，我想向你们学习

浏览 2提问于2021-12-25得票数 0

回答已采纳

2回答

将Str列转换为在Pandas中不工作的Int

python、pandas

我有以下代码来加载数据 import pandas as pd data = pd.read_csv("Salary-Data.csv") data["Income"] = data["Income"].str.strip() #data["Income"] = data["Income"].apply(pd.to_numeric, errors='coerce') #data["Income"] = data["Income"].astype(int) data 这

浏览 6提问于2022-06-05得票数 0

1回答

Python:如何确定一列是否包含至少具有多个列表中的一个值的行？

python、pandas、list、dataframe、loops

我对Python还是个新手，所以请耐心听我说。我有一个数据帧，其中每列引用一个不同的id (公司)，我还有两个包含在list1和list2中的字符串(单词)列表。如果某一列中的任何行至少包含一个来自List1的单词，并且至少包含一个来自列表2的单词，我该如何返回一个哑元(1或0)？我不确定如何将每一列的虚拟对象附加到列表中，以便将其连接到df1。下面的代码返回一个语法错误。 dummy=[] display(df1()) for column in df1: if df1.iloc[:,0].str.contains[list1,list2]: return &#

浏览 25提问于2021-09-07得票数 1

回答已采纳