首页
学习
活动
专区
工具
TVP
发布

基于文献计量的国际人体微生态研究主题分析

人体微生态学是本世纪以来生命科学领域最为重要的前沿领域之一。自2005年以来,美国、欧盟、加拿大等主要国家先后将人体微生态作为国家科技战略重点领域予以布局,极大程度引领推进了该领域的研究,我国也于2016年开始酝酿设立“国家微生物组计划”。近年,国际学界围绕人体微生态领域持续开展了大量的研究,相关研究显示人体共生微生物与免疫系统、消化系统、代谢系统、神经系统、免疫系统疾病等多种生理、病理机制密切相关。未来,人体微生态有望作为重点慢病防治的新的路径,成为生物医学重点领域。

总体而言,作为生命科学、微生物学、生物医学等学科交叉领域的人体微生态研究还处于早期探索和快速发展的阶段,对于该领域的研究特点和趋势的把握与分析均较为困难。研判国际人体微生态领域研究态势与发展趋势,对于学界前瞻布局研究领域和科技管理者合理布局科技资源具有重要意义。既往人体微生态领域宏观综述较少,传统综述侧重专家的定性分析与评述。而基于文献计量学方法的量化分析可为复杂、交叉学科领域综合判断提供定量的依据和较为全面的综合视角。本研究首次探索采用文献计量学方法分析“人体微生态学”领域国际研究论文,综合量化分析人体微生态领域主要研究特点、热点主题和领域,从计量学角度为该领域的重点主题和领域的识别提供量化依据,为今后该领域研究提供重要参考。

1 材料与方法

1.1 论文数据库的构建文献的检索与采集选自美国国家医学图书馆建立的PubMed/Medline数据库。PubMed数据库是国际生命科学和生物医学领域权威数据库,收录了全球最为广泛的同行评议论文的题录信息,并编制了较为完整的医学主题词表(MeSH)用于论文内容的标引与索引。

以“Microbiome,Human”为检索词,检索数据库中“人体微生态领域”研究论文(检索时间2018/1/8),并对检索结果进行限制(Filter),对于论文类型选择研究性论文(research article),论文语言限定为英文(English)。首次检索共得到论文33 024篇。

将首次检索得到的33 024篇论文题录信息和MeSH主题词下载,采用Thomson Data Analyzer计量分析软件(TDA version 3.0,Thomson Reuters Co.,NY)导入并构建文献数据库。使用TDA软件对数据库进行时间筛选(选择近10年,2008年以来)和去重处理,形成31 060篇研究论文题录信息和7 110个MeSH主题词的文献数据库(删去词频为1的主题词)用于主题分析。TDA软件可用于文献题录信息的批量管理和本研究的计量分析。

1.2 文献计量人体微生态领域研究的总体特点主要通过对文献库论文的题录信息(出版年、期刊名、作者、作者机构/国家)进行定量分析获得。同时将MeSH词中反映研究对象和研究方法的主题词标引选出,用于该领域研究设计特点分析。采用共词分析法(co-word)对主要国家研究合作关系进行量化,形成国家间共词矩阵后采用Ucinet 6(Analytic Technologies Co.,Lexington,KY)软件进行可视化网络分析。

根据统计学小概率的基本定义,将出现概率小于1%的主题词作为小概率阈值(频次阈值为31060×1%=311)。逐一解读词频≥311的主题词(共计131个,总计词频占所有主题词词频的53.6%),将其分类至菌群、人体部位、疾病和人群4类中,并采用主题词频次标化法进行热点主题分析。采用共词分析法计算“微生物—疾病”、“疾病—人群”间M×N共词矩阵,选择Ochiai系数对共词矩阵进行标化以消除由于其本身的高频导致的共词频数的升高[15-16],并采用关联度可视化网络的方法进行主题词关联度分析。

1.3 统计分析主题词标化方法为各主题词年度词频数(年度论文中以该主题词标注的总论文数)除以对应年度总论文数。标化词频(normalized frequency,NF)可有效反映该主题词在该时间段的相对重要性,从而排除由于论文基数的增加导致的主题词频数的增加。以近10年主题词(2008—2017年)平均论文占比(标化词频,%)及SD(Standard Deviation,标准差)作为反映对应主题词在该领域的重要(关注)程度的指标,用于热点主题的识别;以主题词NF与对应时间点做线性回归,通过计算回归系数(b)及回归方程显著性检验(F检验)的P值,以反映主题词研究热度的变化趋势(b>0且P

2 结 果

2.1 总体研究特点国际人体微生态领域相关研究论文发表时间分布如图1所示,2000年以来为32 502篇(该领域论文总量为33 024篇,2000年前由于论文较少,为522篇未显示),随时间整体呈上升趋势,研究活跃度逐渐升高。相关研究多集中于近10年,自2008年至今共有31 060篇相关研究,占该领域论文总量的94.1%。选择2008年以后论文数据库进一步分析。

研究方法设计方面,43.5%是人群研究,33.4%为动物实验研究(以human标注的文章共13 523篇,以animals标注的文章共10 386篇)。人群研究中有4.4%的研究为病例‒对照研究(以case-control studies标注的文章共601篇),1.6%的研究为横断面研究(以cross-sectional study标注的文章共210篇),前瞻性研究(以prospective studies标注)多于回顾性研究(以retrospective studies标注)(347篇 vs 115篇)。

人体微生态领域研究论文主要发表在PLoS One(1 837篇,占5.9%)、Sci Rep(682篇,占2.2%)、Front Microbiol(587篇,占1.9%)、Appl Environ Microbiol(493篇,占1.6%)和FEMS Microbiol Ecol(342篇,占1.1%)。

人体微生态领域研究中,发表论文最多的国家分别为美国、中国、英国、法国和德国,论文数分别为8 414篇、3182篇、1885篇、1747篇和1645篇,分别占总数的27.1%、10.2%、6.1%、5.6%和5.3%,其中我国在该领域研究排名第2位,仅次于美国,有较多的研究积累(图2)。对研究论文数量前10位的国家间科研合作度分析显示(图3),美国在人体微生态领域研究国家合作网络中处于中心地位,与中国、英国、加拿大、德国等国家保持较为紧密的科研合作度,分别合作发表论文432篇、283篇、240篇、229篇。在国家间合作中,我国与美国在该领域科研合作最为密切,共合作发表432篇论文,居国家间合作发表论文数量之首。

对人体微生态研究领域主要学者分析显示,美国科罗拉多大学的Dr. Knight Rob,尼德兰瓦赫宁根大学Dr. De Vos,Willem M,法国鲁汶大学Dr. Cani Patrice D,爱尔兰科克大学Dr. Cryan,John F以及法国艾克斯马赛大学Dr. Raoult D等是该领域的主要研究者,发表论文数分别为208篇、154篇、98篇、97篇、94篇。

2.2 热点主题与领域分析通过对高频主题词分类量化,分析人体微生态领域中重点主题,对不同主题间关联度分析初步识别重点领域。

2.2.1 热点主题分析该领域中菌群类别、重点部位微生态、主要疾病和重点人群4方面的主题如表1所示。

2.2.1.1 重点研究菌群人体微生态领域重点研究的菌群包括细菌、真菌和病毒3类(按照主题词标化词频排序)。细菌类是人体微生态领域最为主要的研究对象(论文占比22.3%),其中乳酸杆菌、双歧杆菌、大肠杆菌、古生菌、艰难梭菌、拟杆菌、变形菌等是重点菌群种类,研究论文占比分别为5.1%、4.7%、2.3%、1.6%、1.5%、1.4%和1.0%(论文占比>1%),此外放线菌相关研究占比0.9%。真菌类研究是另一类重点微生态菌群领域,病毒类研究受限于技术困难,相关研究较少,仅为0.3%。趋势分析显示真菌、病毒、变形菌和艰难梭菌相关研究呈显著升高趋势,乳酸杆菌、双歧杆菌研究虽然占比较高,但总体呈下降趋势。

2.2.1.2 微生态重点研究部位胃肠道微生态研究是最为主要的领域(论文占比为13.6%),肠道微生态研究占比为12.5%,其中以大肠(结肠和盲肠)微生态关注度较高(论文占比4.2%和2.1%),而小肠微生态研究偏少(论文占比为1.1%)。此外,阴道微生态、口腔微生态和皮肤微生态均为重点研究领域,相关论文占比分别为1.8%、1.7%和1.6%。趋势分析显示肠道微生态研究趋势略呈降低,可能与近些年人体微生态研究部位相对分散有关。

2.2.1.3 主要相关疾病人体微生态与多种生理和病理机制相关,炎性疾病是最为主要的微生态相关疾病领域(论文占比为3.5%),其中以炎症性肠炎(3.5%)、结肠炎(1.8%)、克罗恩病(1.6%)、肠易激综合征(1.3%)、溃疡性结肠炎(1.3%)、痢疾(1.2%)、梭菌感染(0.9%)为重点主题领域。此外,肥胖、免疫系统疾病、肿瘤(结直肠癌)、2型糖尿病和脑相关研究均是人体微生态相关疾病与健康领域。微生态与肥胖相关研究论文占比为3.5%,免疫系统相关研究占比为1.1%,结直肠癌、2型糖尿病与脑相关研究占比分别为0.9%、0.8%和0.7%。趋势分析显示,炎性肠道系统疾病研究占比呈下降趋势,而梭菌感染、2型糖尿病和脑相关研究呈显著升高趋势。

2.2.1.4 重点人群人体微生态研究覆盖各年龄段人群,主要以成年人和老年人为主,论文占比分别为10.3%和4.2%。婴幼儿、儿童和孕妇研究偏少,相关论文占比分别为3.7%、2.7%和1.8%。

2.2.2 主题词关联度分析采用共词方法对重点主题词间关联度进行量化,并通过网络关系图进行可视化分析,图4为人体主要菌群与疾病间的关系。如图所示,相关菌群与主要疾病间呈较为复杂的网络关系,其中艰难梭菌导致的梭菌感染性疾病和痢疾间关联度较为强烈。

图5显示了微生态研究领域人群与疾病间的关系,其中梭菌感染与老年人群和中年人群关系密切,炎性肠病与儿童、青少年和成年人群关系密切,肥胖与妊娠期女性、成年人、儿童、青少年人群关系密切,免疫系统疾病与妊娠期女性、新生儿人群关系密切,克罗恩病与成年人、青少年关系密切,溃疡性结肠炎与成年人、青少年、年轻人、中年人群关系密切,肠易激综合征与成年人、中年人、年轻人群关系密切,2型糖尿病与成年人、中年人和老年人群关系密切,结直肠癌与中年人、老年人群关系密切。

3 讨 论

3.1 方法学创新性文献计量学是情报学研究领域较为成熟的研究方法,采用量化、统计学和网络关联图等方法分析特定领域研究论文的题录信息和内容信息(主题词、摘要、全文等),为宏观把握某特定领域的重点主题和研究领域提供重要的量化依据。文献计量基于如下理论基础,随着一个新的主题进入某研究领域,围绕该主题的研究论文越来越多,该主题所对应的主题词(本文为MeSH)标注的论文(或论文占比)会随之增多以反映出该变化。共词分析的理论基础是,某领域的研究特点可以通过分析论文中主题词使用特征得到,主题词在论文库中共同出现的频次的高低可作为其关联度高低的量化基础。因此,采用主题词词频(词频占比)和主题词共词分析的方法可研究某宏观领域中重点主题和领域。

与传统综述相比,文献计量学研究在前沿交叉学科领域更具优势。传统综述主要依靠专家大量文献学习和长期研究积累的专家智慧,重在定性判断和前瞻,具有宏观定性的特点。而在前沿交叉领域,往往还未出现对应领域的专家;且在高速发展的前沿交叉领域中,专家对文献学习的速度也相对滞后。文献计量学依赖量化计量结果、辅以专家定性判断对某一宏观领域研究热点和趋势进行判断,具有宏观定量的特点。由此文献计量学研究可以对某特定领域提供宏观定量的综合分析,尤其是在前沿交叉领域具有其独特的优势,既往已广泛用于生态学、城市健康、传染病等诸多领域的分析。

人体微生态领域是近10年国际重要前沿领域,符合领域新、学科交叉、研究活跃等特点,且当前较少有该领域综合性评述。本研究首次将文献计量的方法用于人体微生态领域主题分析,宏观量化展示了该领域主要研究特点、重点主题及关联领域。

3.2 国际人体微生态领域宏观态势分析的应用价值综合本研究结果显示,人体微生态领域研究重点出现在近10年,且呈逐渐升高趋势,未来将成为热点研究领域,美国和我国在全球居于前列且具有较强的研究合作。人体微生态研究涉及部位包括胃肠道、阴道、口腔、皮肤等,其中胃肠道微生态研究论文最多;所研究菌群涉及细菌、真菌、病毒等方面,其中细菌为重点研究方向,但真菌和病毒类研究呈升高趋势;人体微生态相关疾病主要包括炎症性肠病、肥胖、克罗恩病、免疫系统、结直肠癌、糖尿病等,其中梭菌感染、2型糖尿病和脑相关研究呈显著升高趋势;艰难梭菌与梭菌感染和痢疾,梭菌感染、结直肠癌、2型糖尿病与中老年人群,溃疡性结肠炎、克罗恩病与中青年人群,肥胖、免疫系统疾病与妊娠期女性和新生儿等是较为主要研究领域。既往的相关研究都有不同的方面对本研究的结论予以佐证。本研究基于文献计量学方法,宏观识别了国际人体微生态研究态势和热点,可为学界和科技管理方提供重要量化参考。基于当前文献检索,尚未有人体微生态领域的文献计量学研究,本研究结果具有较高的创新性和参考价值。

3.3 研究的不足及建议基于高频主题词和共词分析的重点主题和领域的研究同时受限于高频主题词选择及解读不精确和不全面等问题的局限,未来相关研究应在如下两方面进一步改进:一是进一步探索采用基于论文题目和摘要内容主题词的词频及其关联度研究,以获取更为全面的内容信息;二是探索将基于文献计量学的量化综合分析与传统专家综述相结合,以得出更为全面、客观的研究结论。

具体参考文献 请查阅原文

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190103G0ROG300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券