首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    PNAS:过去二十年心理学论文的可重复性调查

    由于社会科学中的可复制性较弱,学者们渴望量化一门学科的不可复制性的规模和范围。然而,小规模手动复制方法不适合处理这个大数据问题。在这里,我们在科学领域进行了一个全学科范围内的复制普查。包含样本(N=14,126篇论文)几乎涵盖了过去20年里在6家顶级心理学期刊上发表的几乎所有论文。使用一个经过验证的机器学习模型,估计论文的复制可能性,最终结果既支持又反驳了之前相对较小的人工复制样本中所得出的推测。首先,我们发现心理学的单一整体复制率不能很好地捕捉到子域之间不同程度的可复制性。其次,我们发现在所有子领域中,复制率与研究方法密切相关。实验的重复速率明显低于非实验研究。第三,我们发现作者的累积发表数量和被引文的影响与复制的可能性呈正相关,而对研究质量和严谨性的其他相关因素,如作者的大学声望和论文的被引文,与可复制性无关。最后,我们发现媒体关注与复制失败的可能性呈正相关。我们对可复制性的规模和范围的评估是广泛解决可复制性问题的重要下一步。

    03

    23 种深度学习库排行榜:TensorFlow、Keras、caffe 占据前三!

    本文介绍了23种深度学习库,这些库包括TensorFlow、Keras、Caffe、Theano、Torch、MXNet、CNTK、DeepLearning4J、Gensim、R、D3、Deepnet、scikit-learn、MNIST、ImageNet、AlexNet、VGG、ResNet、MemNet、DeepLab、U-Net、Sonnet、TensorLayer、Keras、Caffe2、Paddle、Theano、NLTK、Gensim、OpenCV和scikit-image。这些库在数据科学、自然语言处理、计算机视觉和图像处理等领域得到了广泛应用。其中,TensorFlow和Keras是两种最受欢迎的深度学习库,它们都支持Python,并且Keras正在快速地成为TensorFlow的核心组件。Caffe和Theano是两种广泛使用的深度学习库,它们都支持Python和C++。其他库如MXNet、TensorLayer和Keras也支持多种编程语言,包括Python、C++和R。这些深度学习库在数据科学、自然语言处理、计算机视觉和图像处理等领域得到了广泛应用。

    02

    Nature:相同fMRI数据集多中心分析的变异性

    一、引言 许多科学领域的数据分析工作已经变得越来越复杂和灵活,这也意味着即使相同的数据,不同研究者采用的处理方法和步骤也可能不同,那么得到的结果也不尽然一致。近期,Nature杂志发表一篇题目为《Variability in the analysis of a single neuroimaging dataset by many teams》的研究论文,该研究通过要求70个独立团队分析相同的fMRI数据集,测试相同的9个预先假设,来评估功能磁共振成像(fMRI)结果的这种灵活性的效果。分析方法的灵活性体现在没有两个团队选择相同的方式来分析数据。这种不确定性导致了假设检验结果的巨大差异。报告结果的差异与分析方法的多个方面有关。研究人员的预测市场显示,即使是了解数据集的研究人员,也过高估计了重要发现的可能性。该研究结果表明,分析的灵活性可以对科学结论产生重大影响,并在fMRI分析中识别出可能与变异性有关的因素。该研究的结果强调了验证和共享复杂分析工作的重要性,并说明了对相同数据执行和报告多重分析的必要性。此外,该研究还讨论了可用于减轻与分析变异性有关的问题的潜在方法。 二、背景 科学领域的数据分析工都有着大量的分析步骤,这些步骤涉及许多可能的选择。模拟研究表明,分析选择的不同可能对结果产生重大影响,但其程度及其在实践中的影响尚不清楚。最近的一些心理学研究通过使用多个分析人员的方法解决了这一问题。在这种方法中,大量的小组分析同一数据集,研究发现分析小组的行为结果有很大的差异。在神经影像学分析复制和预测研究(NARPS)中,该研究将类似的方法应用于分析工作流程复杂且变化多样fMRI领域。研究者的目标是以最高的生态效度来评估分析灵活性对fMRI结果的实际影响程度。此外,研究者们使用预测市场(Prediction markets)来测试该领域的同行是否能够预测结果以及估计该领域研究人员对分析结果变异性程度的信念。 三、结果 1.跨团队的结果变异性 NARPS的第一个目标是评估分析相同数据集的独立团队的结果在现实中的变异性。该数据集包括来自108个被试的fMRI数据,每个被试执行一个任务两个版本中的一个,该任务之前被用于研究风险决策。这两个版本的设计是为了解决在任务中关于增益和损耗分布对神经活动影响的争论(数据信息见原文辅助材料)。。 在向70个团队(其中69个团队以前发表过fMRI)提供了原始数据和可选的数据集预处理版本(使用fMRIPrep)后,他们被要求对数据进行分析,以测试9个事先假设(表1),每个假设都包含了与任务特定特征相关的特定脑区活动的描述。分析时间为100天的,各小组需要在全脑校正分析(Whole-brain-corrected analysis)的基础上,报告每个假设是否得到了支持(是或否)。此外,每个小组提交了一份详细的分析方法报告,以及支持每个假设检验的无阈值和有阈值统计图(表2,3a)。为了进行生态效度研究,给这些分析团队唯一的指令就是像往常在自己的实验室里一样进行分析工作,并根据他们自己的标准报告二元决策,即假设中描述的特定区域的全脑校正结果。在预测市场关闭之前,数据集、报告和集合都是保密的。

    00

    KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数|附代码数据

    《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境。在本项目中,我将使用世界幸福报告中的数据来探索亚洲22个国家或地区,并通过查看每个国家的阶梯得分,社会支持,健康的期望寿命,自由选择生活,慷慨,对腐败的看法以及人均GDP,来探索亚洲22个国家的相似和不同之处。我将使用两种聚类方法,即k均值和层次聚类,以及轮廓分析来验证每种聚类方法(点击文末“阅读原文”获取完整代码数据)。

    00
    领券