AI 成为学术评估“主考官”,公布全球最有影响力生物医学研究人员

根据人工智能(AI)计算机程序筛选,埃里克・兰德是目前最具影响力的生物医学研究人员

目前,我们在学术文章搜索上一直都在用谷歌学术搜索,毋庸置疑,谷歌学术搜索的规模最大,涵盖了大约1亿份文档。但其中有很大一部分文档在任何人看来都是非学术性的,甚至还出现了很多可笑的错误。同时,谷歌学术搜索涵盖了互联网上的数据来源,而不只来自审查期刊,因此谷歌学术搜索的量化引用很容易被人操纵,无法忠实地记录这些引用,也没有专门的管理员来处理这个问题。

针对学术搜索引擎的种种不足,2017年,美国一所人工智能研究机构发布了一款新的免费学术搜索引擎——语义学者(Semantic Scholar),它可以提供一些创新的功能,包括从文本中挑选出最重要的关键词和短语,而不依赖于作者或出版商的键入;它还能够帮助科学家理解论文的内容,这是谷歌搜索引擎有待提高的地方;与此同时,它还可以找出论文所引用的真正具有影响力的参考文献。此外,它还会将论文中的数据呈现在搜索结果中,让搜索者一目了然。

在采用科学文献检索工具语义界定的方法——“语义学者”进行检索时,工作人员发现埃里克・兰德(Eric Lander)在生物医学研究领域的人员名单上名列第一。

埃里克・兰德是麻省理工学院博德研究所的所长和创始人。他不仅是一位生物学家,还是一名数学家。埃里克・兰德也是人类基因组计划美国部分的主要贡献者,在人类基因组测序方面做出了巨大贡献。

“语义学者”的发展

艾伦研究所于2015推出语义学者。语义学者是一个旨在解决信息过载问题的学术搜索引擎。它试图使用AI来帮助用户筛选大量的科学论文,并在一定程度上理解检索到的科学论文的内容。目前,这类免费的搜索工具人工智能2(AI2)已经推出。

艾伦研究所是一个非盈利性机构,于2014由微软联合创始人保罗・艾伦(Paul Allen)联合成立于西雅图华盛顿。

通过语义学者来搜索文献档案最初集中应用在计算机科学上,从2016年开始扩大到其他领域。现在,这种方法的应用范围正在进一步扩大,包括在PubMed数据库和其他来源的数据库中的数百万生物医学研究论文。目前总体而言,语义学者分析的论文数现在接近4 000万篇。

鉴于科学界需要衡量研究人员和单位机构的影响力,去年,语义学者也增加了一些新功能,例如,加入“有影响力的引用”的界定,当然不包括任何自我引用。

“语义学者”对生物医学领域研究人员进行排名

2016年4月,该工具对计算机领域的科学家进行了排名,2016年11月它的资料库扩展到神经科学领域,它也被用来评选最具有影响力的脑科学家。现在,语义学者正在对生物医学研究人员进行排名。这是提供给《科学》杂志科学线人栏目的前10名的名单:

1 埃里克・兰德(Eric Lander),麻省理工学院(遗传学)

2 卡尔・弗里斯顿(Karl Friston),伦敦大学学院(神经科学:脑成像数据分析)

3 雷蒙德・多兰(Raymond Dolan),伦敦大学学院(神经科学:阐明情绪的神经机制,以及情绪对认知和决策的影响)

4 审良静男(Shizuo Akira),大阪大学(免疫学)

5 大卫・博特斯坦(David Botstein),Calico公司(遗传学)

6 丹尼斯・史密斯(Dennis Smith),辉瑞制药公司(药代动力学)

7 尤金・库宁(Eugene Koonin),美国国家生物技术信息中心(生物信息学)

8 威利特・威勒特(Walter Willett),哈佛大学公共卫生学院(流行病学)

9 鲁道夫・杰理西(Rudolf Jaenisch),麻省理工学院(遗传学)

10 贝尔特・福格尔斯泰因(Bert Vogelstein),约翰霍普金斯医学院(肿瘤学)

语义学者的优势和不足

科学文献的数量大约每9年增加一倍,使自己时刻保持更新变得越来越困难,玛丽・哈格曼(Marie Hagman)说,“有大量的信息仅仅存在在这些文章中,我们想把它应用到生活中去。我们相信可能从某个PDF文件中挖掘出来的信息可能会提高人类的生活水平或者甚至能挽救人类生命。”

玛丽・哈格曼说,过去,人们使用语义界定的平均次数大概为每月一百万。她希望这个工具能在内容检索方面取得更多成绩,甚至有可能使这种工具自行提出假设以供研究人员来验证。她希望这个工具可以从不同的文件中提取相关的数据、并比较类似的实验结果。“我们认为自动化多角度分析最终肯定会出现” 玛丽・哈格曼说。

该工具的一个限制是,它不能查阅付费的论文。然而,玛丽・哈格曼指出,她的工作小组正在就不同的访问权限与出版商进行商谈。玛丽・哈格曼(Marie Hagman)认为许多其他学术搜索引擎已经存在,例如谷歌学者和微软学术搜索。这些现有的搜索工具中的任何一种都将为某个领域的专家服务,而且这些平台知道专家需要什么。但是对于那些探索不同领域之间的关系或研究新领域的人来说,她认为目前没有其他工具能提供语义界定所能提供的“发现经验”。

专家评论

一位来自宾夕法尼亚大学(UPenn)的AI研究人员兰迪・奥尔森(Randy Olson)表示:“语义学者远比谷歌学者更有用”。“语义学者的人工智能是不是可以分析出一个领域中相对不重要的发现,而这一发现有可能是另一个领域的重大挑战的突破性解决方案?”他问。“时间会证明一切,但我对这一问题持乐观态度。”

一位来自于宾夕法尼亚大学(UPenn)的大数据科学家丹尼尔・希梅斯坦(Daniel Himmelstein)认为:“在未来的某一天,通用的搜索引擎可能会变得非常先进,以至于不需要学术的搜索引擎。而且在信息检索过程中,击败通用的搜索引擎是很困难的,毕竟通用的搜索引擎已经在整个网络中运行了数十年。”

参考文献:http://www.sciencemag.org/news/2017/10/who-s-most-influential-biomedical-scientist-computer-program-guided-artificial

毛毛熊/编译 来自:世界科学(World-Science)

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180103A0W0JK00?refer=cp_1026

扫码关注云+社区