首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    iFeatureOmega: 一个对生物大分子序列、结构和化学小分子进行特征提取、分析和可视化的软件平台

    今天给大家介绍由河南农业大学陈震教授、中国农业科学院棉花所杨作仁研究员、美国弗吉尼亚联邦大学Lukasz Kurgan教授和澳大利亚蒙纳士大学宋江宁教授等团队合作于2022年7月份发表在生物学顶级期刊Nucleic Acids Research上的一个开源的生物分子序列和结构等特征提取工具,iFeatureOmega。该工具可对多种生物分子类型数据进行特征提取,分析并进行可视化展示。这些数据包括序列数据(DNA,RNA和蛋白质序列)、蛋白质结构数据和小分子结构数据。河南农业大学陈震教授、荷兰莱顿大学刘许晗博士、中国农业科学院棉花所赵佩副研究员和蒙纳士大学李晨博士为并列第一作者。该工具在目前所有主流系统包括Windows, MacOS和Linux系统下进行了软件测试运行。iFeatureOmega包含了服务器(Webserver)版本, 图形用户界面(GUI)版本,以及命令行(CLI)版本,来满足不同计算背景下的用户使用需求。文章通过使用iFeatureOmega对蛋白质锌离子结合位点的结构微环境特征作为运行实例充分展示和论证了该工具的强大功能。

    02

    iLearnPlus:核酸和蛋白质序列分析、预测模型构建和数据可视化的开源自动化机器学习平台

    今天给大家介绍由河南农业大学陈震教授、美国弗吉尼亚联邦大学Lukasz Kurgan教授和澳大利亚蒙纳士大学宋江宁教授等团队合作于2021年6月份发表在生物学顶级期刊Nucleic Acids Research上的一个开源自动化机器学习平台。该平台采用“一站式”的方式对生物序列(包含DNA、RNA以及蛋白质序列)进行特征提取和选择、聚类分析、构建和评测机器学习模型,并将预测结果可视化。河南农业大学陈震教授、中国农业科学院棉花所赵佩副研究员和蒙纳士大学李晨博士为并列第一作者。该工具使用Python/PyQt5作为主要开发工具和编程语言,并在目前所有主流系统包括Windows, MacOS和Linux系统下进行了软件测试运行。iLearnPlus平台共包含四个既可独立使用,又可组合使用的系统模块,可以分别实现对生物序列数据进行特征提取、分析、建模以及数据可视化等多种功能。文章通过使用iLearnPlus对对长非编码RNA和蛋白质巴豆酰化修饰的预测作为运行实例充分展示和论证了该工具的强大功能。

    03

    OpenCV SIFT特征算法详解与使用

    SIFT特征是非常稳定的图像特征,在图像搜索、特征匹配、图像分类检测等方面应用十分广泛,但是它的缺点也是非常明显,就是计算量比较大,很难实时,所以对一些实时要求比较高的常见SIFT算法还是无法适用。如今SIFT算法在深度学习特征提取与分类检测网络大行其道的背景下,已经越来越有鸡肋的感觉,但是它本身的算法知识还是很值得我们学习,对我们也有很多有益的启示,本质上SIFT算法是很多常见算法的组合与巧妙衔接,这个思路对我们自己处理问题可以带来很多有益的帮助。特别是SIFT特征涉及到尺度空间不变性与旋转不变性特征,是我们传统图像特征工程的两大利器,可以扩展与应用到很多图像特征提取的算法当中,比如SURF、HOG、HAAR、LBP等。夸张一点的说SIFT算法涵盖了图像特征提取必备的精髓思想,从特征点的检测到描述子生成,完成了对图像的准确描述,早期的ImageNet比赛中,很多图像分类算法都是以SIFT与HOG特征为基础,所有SIFT算法还是值得认真详细解读一番的。SIFT特征提取归纳起来SIFT特征提取主要有如下几步:

    03

    面向机器学习的特征工程 一、引言

    机器学习将数据拟合到数学模型中来获得结论或者做出预测。这些模型吸纳特征作为输入。特征就是原始数据某方面的数学表现。在机器学习流水线中特征位于数据和模型之间。特征工程是一项从数据中提取特征,然后转换成适合机器学习模型的格式的艺术。这是机器学习流水线关键的一步,因为正确的特征可以减轻建模的难度,并因此使流水线能输出更高质量的结果。从业者们认为构建机器学习流水线的绝大多数时间都花在特征工程和数据清洗上。然后,尽管它很重要,这个话题却很少单独讨论。也许是因为正确的特征只能在模型和数据的背景中定义。由于数据和模型如此多样化,所以很难概括项目中特征工程的实践。

    01
    领券