前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何通过机器学习更好的查找自己想要的文献

如何通过机器学习更好的查找自己想要的文献

作者头像
医学数据库百科
发布2021-07-05 10:54:26
8120
发布2021-07-05 10:54:26
举报

对于pubmed检索而言,相信很多人在刚开始使用的时候,会发现,在pubmed当中检索的结果好多都不是我们想要的。感觉有时候根本就不懂我们想要什么内容。如果有这样的困扰的话,可以尝试一下litsuggest(https://www.ncbi.nlm.nih.gov/research/litsuggest/)

数据库运算过程

LitSuggest是一个利用机器学习的算法来输入的文献,进而构建一个基于输入文献的模型,用这个模型用来预测其他文献是否和之前的文献相关。

数据库使用

在LitSuggest当中,每一个新的模型构建,就需要创建一个新的项目。我们可以点击New Project来创建新的项目。

在这里我们可以修改这个项目的标题以及具体的描述。例如,这里我们的目标是想要筛选在线的数据库。所以就把题目和描述修改一下。同时对于之后检索的文献,可以添加一个标签,在LitSuggest当中,默认的是三个标签:Relevant; Irrelevant; TBD。如果觉得不合适也可以自己修改。

在项目进行了基本设置之后,就需要来训练我们的模型了。

对于机器学习而言,如果要进行分析之前首先还是需要做一部分人工的工作,我们要检索的一部分文献来简单的筛选一下,把筛选的文献分成,我们关注的(Positive PMIDs),以及我们不关注的(Negative PMDIs)。在输入的时候,可以对于Positive是必须要输入的。而对于negative可以不输入。

这里,我们把之前21.05汇总的在线数据库的结果的相关PMIDs,输入当Positive.

输入PMIDs之后,点击Train即可获得一个模型。在经过短暂的等待之后,模型就建好了。

模型建好之后,就可以对新的检索式来进行寻找符合自己标准的文献了。数据库提供了两种方式,一种是自己下载PMIDs来进行查询,另外一种则可以直接进行关键词检索,例如我们想要寻找和m6A相关的数据库的话,就可以检索m6A。

在选择好之后,点击Classify就可以得到相关的分析的结果了。在结果当中,通过相关性来对所有的文献进行了分类。在图中可以看到,检索的文献有差不多60篇和预测是很相关的。

同时也可以看到默认的相关文献的词云图。

再往下就是具体哪些文献是相关的,哪些不是相关的了。简单的看了一下,基本上筛选出来的相关的在线数据库的。

总的来说

以上就是这个工具的主要使用方法了,如果有自己特定的方向,也在看过了一些文献之后,得到了自己关注的文献,就可以构建自己的模型的哈。同时LitSuggest还提供了每周自动检索文献的功能。这样就可以得到类似于RSS的功能了。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库百科 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据库运算过程
  • 数据库使用
  • 总的来说
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档