首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

第一篇:《机器学习之入门初探》

这是一篇帮助你了解和理解机器学习、神经网络、深度学习相关概念的文章,如果你对智能领域感兴趣并且想要未来投身AI方向的话,希望你可以耐下心来理解这些概念,以及我后期会向你讲解的各类有趣的算法,因为学习机器学习最重要的就是能够理解它繁多、复杂的概念与算法,当你理解了一定的基础概念之后,我会带你使用Python实现这些算法,并搭建一个你自己的神经网络,刚开始的时候我不会带你使用sklearn库、TensorFlow框架等(因为这对深入了解这些最基础最重要的算法是无益的,也许机器学习的入门会有一些费时费力,但是你只要坚持下来了,你会发现智能围棋、图像识别、语音识别、无人驾驶等前沿的领域在向你招手)

01

手把手教你绘制临床三线表

各位科研芝士的小伙伴,本站本着给大家提供科研便利的宗旨,继续给大家提供干货, 一般的临床研究,统计分析就“三把斧”:统计描述、差异性比较和回归建模。R语言完美解决了统计分析“三把斧”结果整理成规范三线表的麻烦。在统计描述上,R可以根据不同数据的特征给出不同的统计描述方法,在差异性比较方面,R可以给出不同数据比较的不同差异性比较方法,包括t、F、卡方、fisher法和秩和检验;在回归分析上,不仅是Cox回归,线性回归、logistic回归,R同样可以形成规范的表格。这些表格,如果人工来整理,不仅慢,而且不规范!今天我们就攻下这个高地,学习一下如何整理成三线表。

00

Cytoscape插件3:Enrichment Map(1)

早期的基因列表解释依赖于选择一系列高得分的基因,然后建立相当主观奇怪的关系。富集分析是一个自动的,基于严格的统计学的方法来分析和解释很大的基因列表,使用的是先验知识。富集分析来评估输入的基因列表在一个已知功能基因集的上调或下调情况。如果一个基因列表中的基因在这个已知功能集中出现的基因数目显著很多,这很可能预示这,这个生物学过程在作者研究的状况下扮演着重要角色。这个分析可以被其他已知的功能基因集重复,这个功能基因集可能数以千计。 过去几年中,有超过60种富集分析方法和工具出现。他们的主要区别在于 -(a)已知功能基因集的数据库不一样 -(b)用来评估富集的统计学方法不一样。 在接下来的几个部分,我们简要review 基因富集已经存在的几种方法,主要考虑到两个方法。 大多数的富集工具都是来自于GO解释,因为它们对大多数生物来说容易获取,并且覆盖的基因数很多,另外,还有其他一些功能基因集存在,除了GO也还有其他一些工具。功能基因集可以基于他们参与的代谢过程或信号通路来进行定义(比如KEGG,Reactome),也可以由基因表达谱调节的目标基因定义(比如mircoRNA,转录因子),也可以由蛋白质特征定义(比如结构域,染色体位置,与某种疾病的联系,刺激因子,或基因扰动等)。多个来源的功能基因集被一些像MSigDB或WhichGenes收集。不是所有的生物被功能基因集覆盖了,并且很多工具值支持特定的生物。 决定富集的统计学方法要么是基于阈值要么是基于全分布。基于阈值的方法需要用户输入排名靠前的不连续的基因列表,这需要设定一个基于统计学的基因得分阈值。基于超几何分布的Fisher‘s精确单尾检验是阐释这个问题的第一个方法,并且会继续成为这种类型最常使用的方法。这些方法对自然非连续分布列表很有用,但是当对连续的基因得分评判时就有缺点了。尤其,结果如果对阈值的选择不稳定,并且,以二进位的方式对待基因得分有很多信息确实(这里说的二进位指的是要么选中,要么不被选中)。另一方面,基于基因全分布的方法没有门槛threshold-free,因为他们检测基因集靠的是比较他们的得分分布vs背景分布。因为这个原因,他们经常被认为是优于threshold-dependent方法,尤其和一个连续的基因集得分。GSEA(Gene-Set Enrichment Analysis),它的基因排序rank源于差异表达或其他统计学,是最流行的技术之一,虽然也有其他的全分布检验模型被提出。

02
领券