首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

艾瑞克的分享(2):如何快速进入新的研究领域?—Histcites 文献分析软件使用方法

写在前面

作为科研工作者,我们常常需要对一个陌生领域进行文献调研。我们通常使用 Web of Science(WOS) 或者 Google Scholar 进行文献检索,并认为引用频次较高的文章,就是该领域的重要文章。但是,大多数情况下,其搜索结果都不会太理想。因为所统计的引用既包括同行的,也包括外行的,而我们真正想寻找的是那些被同行引用频次最高的文献。同时,进入陌生领域最快速的方式无疑是看最新的综述,但是最新综述的引用频次往往很低,因为发表年限太短,人们往往还没来得及引用。所以,使用引用频次排序的方法往往会把最新的综述文章漏掉。再次,既然是一个陌生领域,我们很可能不知道其热门研究方向,因此往往连用什么关键词都不太清楚,在这种情况下该如何进行文献检索呢?

事实上,上述问题早就有了很好的解决方案—使用HistCite软件,它可以帮助我们在短短几个小时之内对陌生领域大量文献,进行引证关联分析,从而快速描绘出陌生领域的发展脉络,锁定重要文献,找出该领域的明星科学家。

1

Histcite 软件简介及安装

2

Histcite 软件的使用

part 2

Histcite 软件的使用可分为:数据获取—数据导入—数据分析—数据作图等步骤,下面请跟随小编,以“冲蚀涂层(erosion corrosion)”为关键词,利用软件进行该领域的文献分析。

马上开车,let's go~

3

数据获取

part 3

从WOS获取数据下图所示的数据,WOS检索关键词“erosion corrosion”。登录http://www.webofknowledge.com网站,并检索关键词“erosion corrosion”。需要注意的是,数据库必须选择“Web of ScienceTM核心合集”。否则,检索结果无法导出全部引文记录,也就无法使用HistCite进行分析。如下图所示:

点击检索后会出现该数据库中包括该关键词的所有文献,共有4044篇文章,但是Histcite软件单次导出的文件数上限为500,并且考虑到研究领域特点,在筛选时只选择MATERIALS SCIENCE COATINGS FILMS,勾选后点击精炼,获得如下筛选结果:

经过精炼删选后,剩余434篇文献,基本文献被确定后,需要将这些总共434篇文献导出为Histcite所需的格式,具体操作如下图所示:

4

数据导入

part 4

经过从WOS中导出的TXT格式文件并不能直接的被Histcite软件识别,必须将文本文件中的第一行FN Clarivate Alalytics Web of Science改为FN Thomson Reuters Web of Knowledge,如图所示:

经过修改并保存的文件即可导入到软件中,打开时软件会出现如下图所示的提示框,不要关闭,最小化即可:

由于Histcite软件采用IE界面,因此建议采用IE浏览器或者浏览器的IE兼容模式,打开软件,按照如下流程点击:File—Add Files, 如图所示:

注:

当检索到的文献数量大于500时,需要多次导出,而将其导入Histcite软件中时,可分别依次导入,软件会保存每次的导入结果,而最终显示全部的文献数量。

抑或为了后续方便分析,我们依次导入其它数据文件全部导入成功之后,我们可以用File -- Save As ,把所有数据存在一个(*.hci)文件中。这样下次导入数据就不必挨个打开 txt 文件了,直接打开此 hci 文件即可,如图所示:

成功导入到软件中后会显示如下界面:

图红框中有一些列的不同数值,其含义分别为:

Records: 434:当前导入文献数量为434篇(即之前从WOS系统中导出的文献数量),是我们需要分析的文献数量;

Authors:1322:当前434篇文献是由1322位作者共同完成的,点击该链接,我们可以看到该领域的大牛人物;

Journals: 50:这434篇文献共发表在50中不同的期刊杂志上,点击该链接可以看到该领域的文章主要被发表在何种期刊中,这便于我们进行投稿时进行期刊筛选;

Cited References: 9195:表明有 9195 篇文献被全部 434 篇文章所引用。通过点击该链接,我们可以进入这9195篇被引文献的列表。在这个列表中,我们发现很多文献后面都有个绿色的“+”号,这表明这篇文献并没有被本地数据集收录,也就是说通过关键词搜索并没有检索到的文献。每篇文献最后有个 Recs 值,表示这篇文献在当前数据集中被引频次,通过 Recs 排序,我们很快就可以定位重要的被遗漏的文献。

GCS = global citation score:即总引用频次,它表示这篇文章被整个WOS数据库中所有文献引用的次数;

LCS = local citation score :即本地引用次数,它表示这篇文章在当前数据集中被引用的次数。在这个例子里面就是,被导入的 434 篇文献引用的次数。因为导入的文献是 “erosion corrosion” 的搜索结果,所以如果一篇文章的 LCS 值高,意味着它是“erosion corrosion” 领域内的重要文献。

LCR = local cited references :本地参考文献数,它表示这篇文献的参考文献在当前数据集中的数量,即这篇文献引用别人的情况。如果一篇文章的 LCR 值高,意味着它引用了大量的“erosion corrosion” 领域内文献,极有可能是综述文章;

CR = cited references :参考文献数,它表示这篇文章的参考文献在整个 WOS 数据库中的数量;

综上所述可以发现, LCS 和 LCR 更重要,它们分别代表了与本领域相关联的被引用数和引用数, LCS 值高的文章一般是重要的新发现或者新解释, LCR 值高的一般是综述类文章。

补漏文献

需要将上述遗漏掉的重要文献进行补充到我们现在分析的文献中,具体操作为:

首先,拷贝这篇文献的 DOI 值,到 WOS 网站搜索,如图所示:

将DOI输入WOS系统进行检索,如图所示:

然后,勾选搜索到的文献,选择“添加到标记结果列表“,如图所示:

然后,继续搜索下一篇文献,并添加到标记结果列表。等完成所有搜索之后,点击右上角的“标记结果列表”,一次性把所有结果导出来。导出时,如下图示一样,“记录内容”选择“全记录与引用的参考文献”,“文件格式”选择“纯文本”。最后,再将 txt 文件导入到 HistCite中,导入方法与前面介绍的一样。

5

结果分析

part 5

经过对上述不同指标的理解,我们可以通过从不同角度出发,研究该领域的发展情况。

找大牛进入HistCite “Author” 界面,通过点击界面上方的 “Author” 链接(如下图),可以进入作者列表,总共有 1332 位作者。 Recs 代表文章数,TLCS = Total LCS , TGCS = Total GCS。通过这个列表很容易找出该领域内最高产和最具有学术影响力的专家。

收集关键词通过点击界面上方的“Word”链接(如下图),我们可以进入关键词列表,从而了解这个领域目前的研究焦点,记住这些关键词,在后续对某个特定问题进行搜索时会比较方便。

‍‍‍‍‍‍‍‍‍‍生成引证关系图HistCite 开启 “Graph Maker”,选择Tools -- Graph maker(如下图),软件开启一个新窗口

作图界面并不复杂,关键选择是参与做图的文献数量,其余参数都是调整图片中方块、线条和字体的大小。这里选择的是 LCS 排名前 50 的文献。如果对图中某篇文献感兴趣,可以直接点击它,软件会在一个新窗口中打开该文献的详细信息,我们可以预览一下论文的标题和摘要。‍‍‍‍‍‍

点击 make graphe 制作引用图

这张图看起来不是很清楚,在左边的Size选项中选择 Full 模式,重新绘制一张高清图,然后右击图片“另存为”一张图片即可。

图上有 70 个圆圈,每个圆圈表示一篇文献,中间的数字是这篇文献在数据库中的序号。圆圈越大,表示被引用次数越多。不同圆圈之间有箭头相连,箭头表示文献之间的引用关系。多数情况下,你会看到最上面有一个圆圈较大,并有很多箭头指向这篇文章。那么这篇文章很可能就是这个领域的开山之作。

通过我绘制出的这张关系图,我们发现标号为29、49、56、60的四个大圆圈非常显眼,可见这四篇文献的被引次数都是非常高的,我们对全部文献进行按照 LCS 排序,发现前四位刚好就是这 4 篇文献。

选择感兴趣的文献导出根据上图的分析,我们大概可以知道该领域那些文献是比较关键的文章,那些作者是该领域的大牛,因此后续选择特定的文章导出进行精读。

开启“Mark &Tag”

首先,Tools --Mark & Tag(下图),然后界面会有一些变化,出现了一个Marking andTagging Tool工具条,并且每篇文献前面多了一个小方框可以勾选

勾选上感兴趣的文献,然后点击右边的Mark按钮进行标记。界面上方会出现一个“Marks”链接。把所有要导入Endnote的文献,全部标记,然后点击此Marks链接,可显示全部被标记的文献的列表。

然后,File -- Export -- Records,将标记文献导出至一个hci文件

将文献导入至Endnote ,把导出的hci文件的后缀改成txt,然后打开Endnote,File -- Import --File即可。

关于Endnote软件的使用,请自行参考网络资源,或等待小编的下一个分享~

至此,小编带领大家将Histcite软件进行了基本的介绍和实际演练,但是各位在做研究的时候大量广泛的阅读是必不可少的哦,工具的先进代替不了我们自身的全身心投入,so,看完上面的介绍,找到一些好文章,静下心来研究吧~

精分的艾瑞克——罗杰

特别致谢

本文的撰写在结合本人操作经验的基础上,参考了一些网上博主的内容,尤以“白羊座青草莓”博主文章为甚,在此表示致谢~

利益相关

本文的撰写目的即为方便大家学习,故所有图片不设水印,不设转发权限,你们的阅读转发是小编的动力哦~欢迎大家评论转发~

小编

关于本文

编辑:艾瑞克

校稿:川川

图文:罗杰

end

最后,送上一首可爱的歌

愿君遇良人,暖色度余生

END

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180706G1Y7RC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券