使用Pandas将文本文件导入为Dataframe，其中列可以包含多个单词、单个单词或数字

、、

我得到了一个10000行的.txt文件，其中包含标题、imdb评分、投票数、流派和其他有关电影的信息。我们应该将其导入到包含pandas的数据帧中，但我不知道如何告诉pandas在哪里正确分隔列。因此，Pandas将"The“、"Shawshank”、"Redemption“作为单独的字段。我该如何告诉Pandas如何正确地分解.txt文件呢？IPython.core.interacti

浏览 12提问于2021-11-18得票数 0

4回答

熊猫数据过滤器不工作，但str.match()正在工作

、、

我有一个Pandas words_df，其中包含一些英语单词。 words_df.dtypes我想过滤掉包含单词zythum的行。使用Pandas系列str.match()给出了预期的输出：我知

浏览 8提问于2020-05-24得票数 2

回答已采纳

4回答

使用希伯来语标头读取Python read csv

、、、、

我试着用dataset=pandas.read_csv('filename')做一个框架。但不知何故，我不能这样做，因为其中一个列标题是用希伯来语编写的。我检查过了，DataFrame有可能有一个希伯来语单词作为列标题。dataset.columns = ['שלום', 'b','c','d','e']，但是我想从包含希伯来语单词的

浏览 5提问于2017-11-20得票数 6

2回答

为包含字符串列表的Pandas系列拆分多个字串为单独的单词

、、

我有一个，它将列值作为字符串列表。每个列表可能有一个或多个字符串。对于包含多个单词的字符串，我希望将它们拆分为单个单词，以便每个列表只包含单个单词。在下面的Dataframe中，只有sent_tags列有包含可变长度字符串的列表。DataFramepd.set_option(&#

浏览 1提问于2019-03-18得票数 3

回答已采纳

2回答

具有多个值的Pandas read_csv导入列作为列表

、、、

我有一个包含多个列的.csv文件，其中一列包含多个值：some_string; 1 ; 1,2,3,4 ;import pandas as pd df = pd.read_csv('file.csv'

浏览 8提问于2020-02-26得票数 1

回答已采纳

3回答

提取大熊猫列中每个单词的第一个字符串

、、

我有如下的DFGRE MET HOCK 38 我希望创建一个列，其中包含来自col1的每个单词的第一个字符串，但保留整数，如下所示 col1

浏览 3提问于2021-10-19得票数 4

回答已采纳

1回答

C++中的散列词？

、、、

我有一个文本文件，我从其中读取数据并搜索里面的名称来跟踪它。为了加快搜索速度，我想使用散列而不是数组，如果名称已经包含在散列中，我不想插入两次。(我找到了一些关于散列的代码，但示例代码用于数字，而不是字符串或单词。我该怎么接近？将第一个字母保存在ASCII中，还是将所有字母和%合并成一个数字？不知道该怎么做。)假设；使用Getline获取

浏览 0提问于2022-01-26得票数 -2

回答已采纳

1回答

如何在包含现有行的字符串中的单词的pandas数据框中创建新行？

、

我在pandas中有一个DataFrame，它有一个名为df.strings的列，其中包含文本字符串。我想要获取这些字符串在其自己的行上的单个单词，以及其他列的相同值。例如，如果我有3个字符串(以及一个不相关的列Time)：0 The dog 4Pm2 The fox 1Pm 我希望新行包含字符串中的单词string

浏览 4提问于2013-03-14得票数 8

回答已采纳

1回答

访问-字段验证规则-限制为一种语言

我目前正在尝试将验证规则放在一个文本字段上，该文本字段应该包含几个英文单词和数字，而不包含其他语言或字符。我尝试将验证规则设置为： Is Null or Not Like "*[!0-9]*" 这导致将该字段限制为空或单个单词。因为这个领域需要几个单词和数字，所以这些解决方案都不合适。我还尝试简单地删除代码块开头的星号： Is Null or

浏览 17提问于2019-02-04得票数 0

回答已采纳

1回答

熊猫数据自定义分类

、、

我有一个(非常大的)使用pandas.DataFrame的表。它包含文本中的字数；索引是单词列表：a 1 1 0short 2 0 0我想根据所有文本中单词的频率对单词列表

浏览 3提问于2013-10-05得票数 1

回答已采纳

3回答

Pandas:如果变量为true，则返回功能名称

、、、、

我有一个大约2M字符串的列表和一个大约800个单词的列表。我已经创建了一个数据帧，其中字符串作为行，单词作为列。除了字符串变量之外，所有其他变量都是true或false值，与单词是否在字符串中相对应。不存在缺失值。即 import pandas as pd df = pd.DataFrame({'strings':['a string with california',的新手，并且已经了解到可以

浏览 21提问于2019-02-01得票数 1

回答已采纳

4回答

如何从文本文件Java中读取一个单词(或行)？

、、、、

正如标题所述，我试图编写一个程序，该程序可以从文本文件中读取单个单词并将它们存储到String变量中。我知道如何使用FileReader或FileInputStream来读取单个char，但对于我正在尝试的内容来说，这是行不通的。一旦输入这些单词，我就会尝试使用.equals将它们与我的程序中的其他字符串变量进行比较，所以最好将它们作为String导入。我也可以将文本文件<

浏览 8提问于2015-07-12得票数 5

回答已采纳

2回答

在Pandas中将列连接为索引

、

我正在将一个文本文件导入到pandas中，并希望将该文件中的3列连接起来以建立索引。我最终希望索引是连接前3列中的值的值。

浏览 2提问于2013-07-24得票数 9

回答已采纳

1回答

具有给定术语的文档的PySpark HashingTF计数

、、

我有一个spark数据框，其中的" text“列有一些文本。我想要计算出现各种单词的行数-本质上是出现“术语”的“文档”的数量-以及相关的计数，如最频繁的单词，具有最频繁单词的行(或称为文档)。我正在使用来自pyspark.ml.feature的HashingTF。但是似乎找不到一种有效的方法来从输出中提取这些信息。# As an example create a Pandas-dfpanda

浏览 25提问于2021-08-31得票数 0

回答已采纳

1回答

当无法在Java中使用IndexOf时，如何从两个特定点选择字符串的一部分

、

WordArray从文本文件中获取单词及其同义词，并将它们作为Word对象存储在array中。然后，我有一个名为Search()的方法，其中使用一个参数来查找与参数部分匹配的所有单词。例如:如果参数是rep，该方法将返回被压缩和表示的单词)，或者一个与参数完全相同的单词。如果有多个与参数匹配的单词，则该方法将包含一个数字(从1开始)，并将其放在单词</e

浏览 0提问于2017-07-25得票数 2

2回答

如何在pandas* dataframe中使用列表作为值？*

、、、、

我有一个数据帧，它要求列的子集具有具有多个值的条目。下面是一个包含“runtime”列的dataframe，其中包含程序在各种条件下的运行时：1 b [0.5, 0.75, 1] 如何处理此数据帧，并让<em

浏览 0提问于2014-11-08得票数 8

回答已采纳

1回答

搜索包含所有特殊字符的数据库表

、、、、

我有一个项目表，其中我有一个项目名称，项目名称可以包含任何特殊字符、任何字母数字值或数字、单词或特殊字符的任何组合。我使用的是带有java hibernate api的MySQL5.0。

浏览 2提问于2013-09-27得票数 0

2回答

Python: 2000文本列表中单词的返回数

、、

我几乎可以肯定，我忽略了一些非常明显的东西，所以我问这个问题，希望感到尴尬:我在一个专栏中有一个带有2000多条文本的pandas数据。我最初的目标是，而且仍然是，计算每个文本中的单词，并在dataframe中创建一个新列，并使用该单词count。为了简化问题，我使用以下方法将文本列提取到字符串列表中：类型为list，列表的len为</

浏览 3提问于2016-12-15得票数 0

回答已采纳

2回答

分组和计数项目

我有一个.csv文件(words.csv)，其中包含用逗号分隔的5000个单词。大多数字符串都是重复值。我是否可以使用LINQ执行以下操作：因此，如果苹果已经重复了5次，而banana 3 times..it应该显示为banana -3等等B.创建另一个去掉重复项的文本文件。

浏览 5提问于2009-10-25得票数 5

2回答

Python - excel -使用两个csv字典计算单元格中的单词数。

、、

我有一个Python代码，用于统计文本(.txt)文件中出现的单词：ignore = set(find_words(open('Ignore words.csv').read().lower())) lineWords=find_words

浏览 3提问于2015-09-25得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

熊猫数据过滤器不工作，但str.match()正在工作

使用希伯来语标头读取Python read csv

为包含字符串列表的Pandas系列拆分多个字串为单独的单词

具有多个值的Pandas read_csv导入列作为列表

提取大熊猫列中每个单词的第一个字符串

C++中的散列词？

如何在包含现有行的字符串中的单词的pandas数据框中创建新行？

访问-字段验证规则-限制为一种语言

熊猫数据自定义分类

Pandas:如果变量为true，则返回功能名称

如何从文本文件Java中读取一个单词(或行)？

在Pandas中将列连接为索引

具有给定术语的文档的PySpark HashingTF计数

当无法在Java中使用IndexOf时，如何从两个特定点选择字符串的一部分

如何在pandas* dataframe中使用列表作为值？*

搜索包含所有特殊字符的数据库表

Python: 2000文本列表中单词的返回数

分组和计数项目

Python - excel -使用两个csv字典计算单元格中的单词数。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐