首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

功能连接体指纹的特征选择框架

基于功能连接组(FC)来独特描述个体特征的能力是迈向精确精神病学的关键要求。为此,神经成像界对FC指纹进行了越来越多的研究,开发了多种有效的FC指纹识别方法。最近的独立研究表明,在大样本尺寸和较粗的分区用于计算FC时,指纹识别的精度会受到影响。量化这一问题,了解这些因素影响指纹准确性的原因,对于开发更准确的大样本量指纹提取方法至关重要。指纹识别的部分挑战在于,FC既能捕捉通用信息,也能捕捉特定个体的信息。一种识别特定个体FC信息的系统方法对于解决指纹问题至关重要。在本研究中,我们解决了我们对FC指纹识别问题的理解中的三个空白。首先,我们研究了样本量和分区粒度的联合效应。其次,我们解释了随着样本量的增加和分区粒度的减小,指纹识别精度降低的原因。为此,我们使用了来自数据挖掘社区的聚类质量指标。第三,我们开发了一个通用的特征选择框架,用于系统地识别静止状态功能连接(RSFC)元素,该元素捕获信息,以唯一地识别主体。综上所述,我们从这个框架中评估了六种不同的方法,通过量化受试者特定指纹的准确性和随着样本量增加而降低的准确性,以确定哪种方法对质量指标的改善最大。

03

我对安全与NLP的实践和思考

通过对安全与NLP的实践和思考,有以下三点产出。首先,产出一种通用解决方案和轮子,一把梭实现对各种安全场景的安全检测。通用解决方案给出一类安全问题的解决思路,打造轮子来具体解决这一类问题,而不是使用单个技术点去解决单个问题。具体来说,将安全与NLP结合,在各种安全场景中,将其安全数据统一视作文本数据,从NLP视角,统一进行文本预处理、特征化、预训练和模型训练。例如,在Webshell检测中,Webshell文件内容,在恶意软件检测中,API序列,都可以视作长文本数据,使用NLP技术进行分词、向量化、预训练等操作。同理,在Web安全中,SQLi、XSS等URL类安全数据,在DNS安全中,DGA域名、DNS隧道等域名安全数据,同样可以视作短文本数据。因此,只要安全场景中安全数据可以看作单变量文本数据,这种通用解决方案和轮子就适用,轮子开源在我的github仓库FXY中,内置多种通用特征化方法和多种通用深度学习模型,以支持多种安全场景的特征化和模型训练,达到流水线式作业。

02

数据建模1,2,3

1.何为建模? 数据几乎总是用于两种目的:操作型记录的保存和分析型决策的制定。简单来说,操作型系统保存数据,分型型系统使用数据。前者一般仅反映数据的最新状态,按单条记录事务性来处理;其优化的核心是更快地处理事务。后者往往是反映数据一段时间的状态变化,按大批量方式处理数据;其核心是高性能、多维度处理数据。通常我们将操作型系统简称为OLTP(On-Line Transaction Processing)— 联机事务处理,将分析型系统简称为OLAP(On-Line Analytical Processing)— 联机分析处理。 针对这两种不同的数据用途,如何组织数据,更好地满足数据使用需求。这里就涉及到数据建模问题。即设计一种数据组织方式(模型),来满足不同场景。在OLTP场景中,常用的是使用实体关系模型(ER)来存储,从而在事务处理中解决数据的冗余和一致性问题。在OLAP场景中,有多种建模方式有:ER模型、星型模型和多维模型。下面分别说明下:

05
领券