首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何按职务名称筛选数据集?

如何按职务名称筛选数据集?
EN

Stack Overflow用户
提问于 2018-11-25 20:47:25
回答 1查看 447关注 0票数 1

我试图提取“数据科学家”和“高级数据科学家”职位的公司、职务描述、评审和位置。一开始,我试图为数据科学家获得一个输出,但未能做到。数据集重复了这两项工作,我正在尝试详细说明所有提到“数据科学家”或“高级数据科学家”的实例。

代码语言:javascript
运行
复制
dataset['position']=dataset.position.str.lower()
dataset
        position            company     description      reviews     location
0   data scientist lead     ALS TDI   This position is...  30.0    Atlanta
1   NaN                      xyz        qualified candid.. 4000.0   Texas
2   data scientist           xcv       python desireable..  232.0    toronto
3   data scientist           intel     CS Degree needed..  322145.0   Newyork
4   senior data scientist   amazon     python, excel....   23222.0     montreal
.
.
5000  data scientist/machine  yahoo   sql needed plus...  Nan            Atlanta

我使用下面的内容创建了一个数据,它显式地记录了只显示“数据科学家”的位置,而不是索引0和5000中的变体。

代码语言:javascript
运行
复制
filtered = dataset[dataset['position'].str.contains('data scientist', na=False)]

但是它不能工作,因为它提供了字符串中包含“数据科学家”(包括“高级数据科学家”和“数据科学家/机器”)的所有记录。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-26 00:25:41

pd.Series.str.contains用于查找包含给定字符串的的值。

ps.Series.eq,或等效的相等运算符==,用于查找等于给定字符串的值。

pd.DataFrame.query提供了一种通过字符串查询数据的方法。

因此,您可以使用以下其中之一:

代码语言:javascript
运行
复制
filtered = dataset[dataset['position'].eq('data scientist')]
filtered = dataset[dataset['position'] == 'data scientist']
filtered = dataset.query('position == "data scientist"')
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53471802

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档