腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3726)
视频
沙龙
2
回答
用
Pandas
DataFrame
中最
常用
的
单词
替换
单元格
、
、
、
、
我有一个这样
的
DataFrame
: df = pd.
DataFrame
({'Source1': ['Corona,Corona,Corona','Sars,Sars','Corona,Sars',Corona,Sars A,B,B,C4 Sars A,B,C 我想检查每列中
的
每个
单元格
(实际数据有许多列),并找到每个唯
浏览 44
提问于2020-04-13
得票数 3
回答已采纳
1
回答
训练和测试数据中缺失值
的
机器学习问题
、
、
在我
的
培训数据中,文本部分
的
.csv文件中有空值,测试文件中也有空值。我已经将这两个文件转换为一个
dataframe
(
Pandas
)。这是总体数据
的
一小部分(小于0.01)。了解这一点--
用
空字符串
替换
空文本字段更好,还是将其保留为空?如果答案是
用
空字符串
替换
,那么在针对模型运行测试csv文件之前,对它执行同样
的
操作是否“可以接受”?
浏览 4
提问于2022-05-22
得票数 0
2
回答
如何在
Pandas
dataframe
(Python)
的
语料库中找到最频繁
的
词组
、
、
、
、
我有
Pandas
,如下所示,我标记了我
的
文本文件,并使用NLTK Countvectorizer将其转换为
pandas
数据。此外,我已经删除了断句和标点符号从我
的
沙发。我试图在我
的
语料库中找到
pandas
数据
中最
常用
的
单词
。在下面的
dataframe
中,“亚伦”和“放弃”这样
的
单词
出现了>10次,因此这些词应该在新
的
datafram
浏览 0
提问于2019-04-20
得票数 0
回答已采纳
1
回答
我想要英语
中最
常用
的
单词
、
、
、
我想要英语
中最
常用
的
单词
。基本上,我正在处理维基百科
的
文本,即使删除了停用
的
单词
,也会遇到很多
单词
。我试着
用
谷歌搜索
常用
的
单词
,但得到了下面的链接。 谢谢
浏览 2
提问于2010-09-02
得票数 1
回答已采纳
1
回答
使用阿拉伯字符绘制直方图
、
、
、
、
我正在尝试绘制
用
arabic编写
的
最
常用
单词
的
直方图,但我想不出一种方法。我能得到
的
只有分片
的
字符,而不是编译后
的
单词
。 下面是我得到
的
一个例子: ? import seaborn as sns 'الذكاء': 8, 'هو': 2,
浏览 14
提问于2019-05-24
得票数 6
3
回答
在
Dataframe
Pandas
中统计句子
中最
常用
的
100个
单词
、
我在
Pandas
dataframe
中
的
一列中有文本评论,我想要计算N个最频繁
的
单词
及其频率计数(在整个列中-而不是在单个
单元格
中)。一种方法是使用计数器通过迭代每一行来计算
单词
数。有没有更好
的
选择? 代表性数据。
浏览 0
提问于2015-04-28
得票数 24
回答已采纳
1
回答
中文文本
的
TF-IDF算法
、
、
我正在对中文文本进行TF-IDF,并搜索文本
中最
常用
的
10个
单词
。有没有办法只获取有意义
的
单词
?我
用
“解吧”把汉语句子切成
单词
。
浏览 2
提问于2020-07-23
得票数 1
1
回答
Pandas
dataframe
中
的
标记文本
、
、
我有一个
Pandas
DataFrame
,它
的
脚本是从外部来源收集
的
。列text_content包含脚本内容。最长
的
脚本由85.617个字符组成。一个常见
的
用
例是,我们将有一个表名列表,并且希望知道它们出现在其中
的
脚本。如果我们需要在SQL中这样做,它将要求我们使用LIKE操作符执行通配符搜索,这在性能上是很糟糕
的
。因此,我希望在脚本仍在
DataFrame
中时从它中提取
单词
,从而生成一个两列表,每一
浏览 1
提问于2016-01-22
得票数 0
回答已采纳
2
回答
如何在计算文本中
单词
准确性
的
频率时忽略一些
单词
?
、
、
、
、
当我计算文本中
单词
准确性
的
频率时,我怎么能忽略像'a',' the‘这样
的
单词
呢?import
pandas
as pd df= pd.
DataFrame
({'phrase但是我想把距离作为最
常用
的
词。
浏览 3
提问于2015-09-24
得票数 1
回答已采纳
3
回答
用
Pandas
dataframe
中最
近邻
的
值
替换
值
、
、
在获取熊猫中
的
一些行
的
最近值时,我遇到了一个问题--
dataframe
,然后用这些行
的
值填充另一列。A A6 250 100B B2 30 2 问题是,在任何match_v等于100
的
地方,我都需要从r_value是最接近原始行( match_v等于100)
的
行中
替换
100,但只
替换
withing组(按id分组)。A5 250
浏览 0
提问于2019-05-30
得票数 8
回答已采纳
3
回答
移除出现在整个数据框中
的
特定值
、
、
我有一个df,在许多行和列中出现'-1‘,这是错误
的
数据。
浏览 19
提问于2021-04-26
得票数 0
回答已采纳
1
回答
将
Pandas
Dataframe
中
的
部分字符串
替换
为字典值
、
、
、
我有一个
Pandas
DataFrame
(df),其中一些
单词
包含编码
替换
字符。我想用字典(翻译)中
的
替换
单词
替换
这些
单词
。translations = {'gr�nn': 'gronn', 'm�nst': 'menst'} df = pd.
DataFrame
(["gr�nn Y", "One gr�nn
浏览 27
提问于2019-03-04
得票数 4
回答已采纳
1
回答
如何真正过滤熊猫数据集而不离开各地
的
Nans
、
、
假设我有一个巨大
的
DataFrame
,它只包含少数几个与我执行
的
过滤匹配
的
单元格
。如何才能在一个新
的
dataframe
中只获得与其匹配
的
值(以及它们
的
索引和列),而不使用整个其他
的
DataFrame
,而后者变成了Nan。使用dropna删除Nans只会删除整个列或行,而filter
用
Nans
替换
非匹配项。这是我
的
密码: import numpy
浏览 2
提问于2020-12-18
得票数 1
回答已采纳
1
回答
如何用列表中
的
for循环
替换
熊猫
的
数据?
、
、
、
我正在尝试逐行
替换
单个列值(现在用整个
dataframe
替换
),其基础是要
替换
的
单词
列表(如果在不同
的
列表中找到
单词
)。它们有匹配
的
长度,所以索引应该可以工作。 例如。如果列表一中
的
“朋友”,
用
列表二中
的
“好友”代替。data = {'col_1': [3, 2, 1, 0], 'col_2': ['a', 'b
浏览 0
提问于2018-07-20
得票数 0
1
回答
使用.isin
pandas
.
DataFrame
方法删除至少在给定列表中有值
的
单元格
的
行
、
我正在尝试使用.isin方法,但我没有预期
的
结果。下面是一个最小
的
可重现性示例df = pd.
DataFrame
({'num_legs': [2, 4], 'num_wings': [2, 0]}, index=['falcon', 'dog'])print(df[df.isin([0, 2])]) 它不删除行,而是
用
NaN
替换
单元格</
浏览 14
提问于2022-10-21
得票数 1
回答已采纳
1
回答
用
Pandas
Dataframe
中最
常见
的
值
替换
行值
、
、
、
、
item),Q1344 (item)列‘type’实际上是'TypeList‘
的
扁平列而freq列表示列类型中每个值
的
频率。这些频率来自整个数据。在这里,我只是增加了几行。例如,Q571在types列中发生了9次,因此有freq=9。TypeList列是每个记录
的
类型列表。我想要添加新列SuperType,如果TypeList列包含多个类型,它将具有最频繁
的
类型。| Q785479 1
浏览 2
提问于2017-10-12
得票数 1
回答已采纳
1
回答
在
Pandas
dataframe
中找到最
常用
的
单词
、
、
、
我认为代码可以
用
更好、更紧凑
的
形式编写。由于移除停止词
的
方法,它
的
编译速度相当慢。我这样做
的
方式如下:
浏览 0
提问于2020-09-13
得票数 5
回答已采纳
1
回答
如何计算熊猫
中最
频繁重复
的
短语
、
、
我有一个文本列
的
Pandas
dataframe
。我想要计算一下本专栏
中最
常见
的
短语。例如,从文本中,你可以看到像a very good movie,last night等这样
的
短语经常出现。我认为有一种定义n-gram
的
方法,例如,该短语在3到5个
单词
之间,但我不知道如何定义。import
pandas
as pd text = ['this is a very good movie that we watched l
浏览 5
提问于2020-02-03
得票数 2
回答已采纳
3
回答
用
php在文本
中最
常用
的
单词
、
、
、
我在stackoverflow上找到了下面的代码,它可以很好地找到字符串
中最
常用
的
单词
。但是我能排除像"a,if,you,have,等“这样
的
常用
词吗?或者我必须在计数后删除元素?我该怎么做呢?
浏览 0
提问于2010-07-05
得票数 3
2
回答
在帖子标题中找到最
常用
的
单词
、
是否有任何技术方法来搜索文章标题并返回其
中最
常用
的
重复
单词
的
结果?敏捷
的
棕毛狐狸从懒狗身上跃过新纪录运动员跳得更高棕色 跳跃
浏览 0
提问于2020-09-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel 中最常用的 if 函数在 Power Query 中怎么用?
肝了3天,整理了90个Pandas案例
利用Python做数据分析——10分钟入门Pandas(二)
Python数据科学实战:从数据清洗到可视化
手把手教你做一个“渣”数据师,用Python代替老情人Excel
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券