学习
实践
活动
工具
TVP
写文章

2022 全球 AI 模型周报

本周介绍了 5 个视频相关的 SoTA 模型:VideoMAE 成功在视频模型中加入超高遮蔽率、ViS4mer 处理长视频高效又低成本、Flamingo 只需小样本就能胜任多种视觉语言任务,VDTN 用多模态的概念重新定义对话状态追踪任务 使用一些简单的设计,模型就能够有效地克服视频重建过程中由于时间相关性引起的信息泄漏问题。即使当遮挡率很高的时候(90%-95%),模型仍然可以获得良好的性能。 为了不让模型从高度相似的相邻帧学到重建的知识,模型使用非常高的遮盖率从视频中删除时间立方体。同时,这一操作也降低了编码器-解码器架构的预训练成本。 Self-Supervised Video Pre-Training 更多资料:VideoMAE:南大MCG&腾讯AI Lab 提出第一个视频版MAE框架,使用90%甚至95%遮挡,性能SOTA! Flamingo 探索了开放式多模态任务(例如视觉问答、描述任务)以及封闭式任务(例如多项选择视觉问答),证明了该架构的单个模型就可以使用少量学习的最新技术,只需通过特定任务示例提示模型即可。

6610

AI面试题之 判别模型&生成模型

直观理解 【先给出最直观的理解】 【判别式模型】:要确定一个图片是猫还是狗,用判别模型的方法就是根据数据集X训练模,然后把新的图片输入到模型中,模型给出这个图片是每个类别的概率。 【生成式模型】:生成式模型是对原始数据集X和其标签Y建模,生成其联合概率。然后将新的图片放入是否是猫的模型中,看概率是多少;然后将新的图片放入是否是狗的模型中,看概率是多少。 ---- 2. 【相当于给出X,让模型告诉你Y】 判别模型比较常见:线性回归,SVM,神经网络,决策树。 3. 生成模型 生成模型可以理解为把类别,也当成一个特征。然后寻找(X,Y)的分布。 【相当于给出X和Y,让模型告诉你这个组合的概率】 常见的模型有:高斯混合模型,朴素贝叶斯模型。 喜欢的话,长按下面的二维码关注下【机器学习炼丹术】,成为炫酷的炼丹师吧! 目前在更:每天一两个AI面试干货知识点。 公众号中回复【下载】有免费的精选的机器学习相关的学习资料哦,持续更新哦! 欢迎大家加好友,交流学习知识,携手并进。

42220
  • 广告
    关闭

    年末·限时回馈

    热卖云产品年终特惠,2核2G轻量应用服务器6.58元/月起,更多上云必备产品助力您轻松上云

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI探索(三)Tensorflow编程模型

    Tensorflow编程模型 。。。。

    18730

    干货 | 攻击AI模型之DeepFool算法

    AI 科技评论按:本文为“兜哥带你学安全”系列之三,首发于AI科技评论,未经许可不得转载。 概述 在前面文章《对抗样本的基本原理》中,我们介绍了生成对抗样本的基本思路,其中大体思路分为白盒攻击和黑盒攻击,区别在于黑盒测试把模型当做黑盒,只能输入样本获得预测结果,白盒在黑盒的基础上还可以获取模型的参数 DeepFool基本原理 在《攻击AI模型之FGSM算法》中,我们介绍了FGSM的基本原理。一个很好的问题就是,我们究竟对原始图像做了多大修改就可以欺骗AI模型呢? 换个说法就是,如何尽量少的修改原始图像就可以达到欺骗AI模型的目的呢?首先我们先看下我们对原始图像做了哪些修改。假设我们原始图像为x0file,对抗样本为x1file,将原始图像保存成向量。 攻击图像识别模型 以攻击InceptionV3模型为例,介绍生成攻击样本的基本原理。Keras内置了这个模型,我们直接使用就可以了。从模型中直接获取第一层的输入作为输入层,最后一层的输出为输出层。

    1.3K30

    Ai 模型并行运行实践方案

    本文记录并行Ai的一种实践路线。 背景 当遇到一个任务需要多个Ai模型分别完成时,串行执行Ai可能不是最好的方法,总无法发挥GPU的最大利用率 现有平台少有并行推断的相关信息 尝试搭建一个服务式的并行Ai执行框架 思路流程 构建网络服务,在网络服务中初始化模型 留出infer接口作为服务器备用 客户端多线程向服务器提供请求,实现Ai并行执行 技术方案 python平台 使用flask搭建微服务框架 将训练好的模型在服务器中初始化 ,留出infer接口,注册在路由中 服务端建好服务后 while True 在那呆着 客户端将测试数据作为 post 请求向指定ip 端口 路由发送请求 服务器收到数据进行Ai推断得到结果 pytorch

    12110

    数据越多,AI决策模型越脆弱

    最后,基于上述观察,作者论证了这么一个观点:数据驱动的AI模型,在做决策时候,极易受到攻击。 1 AI 的方向存在偏差 面对一个难题,分步骤、有条理的解决方案是值得肯定的。有哪些假设? 而无论哪种类型的数据出现问题,都有可能阻碍AI模型的开发,或者影响AI模型做决策。 数据出问题的方式有很多,例如:数据实际上不正确、已损坏或采用错误格式。 如果有攻击者试图往模型、系统中注入“错误”,那么这些问题更不可能解决了。 AI虽然创造了新机会,但我们也不能忽略它的脆弱性。换句话说,AI带来新解决方案的同时,也发明了新攻击方法。 当前的AI系统完全依赖数据质量,虽然技术已经比较成熟,但这种设计方案极易受到攻击。因此在这种情况下,AI系统必须被设计成能够灵活应对不良数据的模型。让 AI“反脆弱”是一种抵御攻击风险的方式。 这时候,AI决策模型的作用是提示医生将可能的疾病类型纳入他的决策树,所以尽管可能数据不佳,但患者的治疗效果却有所改善。

    17330

    干货 | 攻击AI模型之FGSM算法

    AI 科技评论按:本文为“兜哥带你学安全”系列之二,首发于AI科技评论,未经许可不得转载。 概述 在前面文章《对抗样本的基本原理》中,我们介绍了生成对抗样本的基本思路,其中大体思路分为白盒攻击和黑盒攻击,区别在于黑盒测试把模型当做黑盒,只能输入样本获得预测结果,白盒在黑盒的基础上还可以获取模型的参数 以最常见的图像识别为例,我们希望在原始图片上做肉眼难以识别的修改,但是却可以让图像识别模型产生误判。 完整的模型结果如下。 ? 批处理大小为16,经过20轮训练。 攻击图像识别模型 以攻击InceptionV3模型为例,介绍生成攻击样本的基本原理。Keras内置了这个模型,我们直接使用就可以了。从模型中直接获取第一层的输入作为输入层,最后一层的输出为输出层。

    3.5K31

    AI 语言模型真的是越大越好吗?这个模型优于 Gopher

    编译 | 禾木木 出品 | AI科技大本营 近年来对于 AI 语言模型的有一个争议就是 —— 越大越好。 DeepMind 正在质疑这个理由,并表示给 AI 一个记忆可以帮助与它 25倍大小的模型竞争。 去年 6 月,OpenAI 发布 GPT-3 模型时,就重写了语言 AI 的规则手册。 他们发现了一个更大的问题,依靠越来越多的计算能力在 AI 领域取得进展意味着该领域的尖端技术对于除了资源丰富的商业实验室外的所有人来说都是遥不可及的。 研究人员发现,只有 70 亿个参数的 RETRO 模型在各种语言任务上都可以胜过 AI21 Labs 制作的 1780 亿个参数的 Jurassic-1 转换器,甚至在大多数方面都优于 2800 亿个参数的 参考链接: https://singularityhub.com/2021/12/20/biggers-not-always-better-deepminds-new-language-ai-is-small-but-mighty

    25330

    AI模型注册成MLSQL UDF函数示例

    训练一个Tensorflow模型 下面的代码仅支持Console notebook模式下运行 首先,准备minist数据集 include lib. model_binary model_binary = ray.get(train.remote()) ray_context.build_result(model_binary) 保存模型 `ai_model.mnist_model`; 把模型注册成UDF函数 下面代码可以在Console中以脚本或者Notebook形态运行 ! python conf "rayAddress=127.0.0.1:10001"; -- 加载前面训练好的tf模型 load delta. `ai_model.mnist_model` as mnist_model; -- 把模型注册成udf函数 register Ray.

    7310

    QCOM 开源AI模型效率工具包

    这些每瓦性能改进背后的推动力一直是我们在AI模型效率方面的领先研究。所谓模型效率,是指缩小模型,减少计算,减少内存流量,降低延迟并有效使用硬件的技术。 高通创新中心(QuIC)很高兴在GitHub上开放AI模型效率工具包(AIMET)以便与其他领先的AI研究人员合作,并为AI开发人员提供一个简单的库插件,以利用最新的模型效率性能。 AIMET大规模节能AI AIMET是一个支持受过训练的神经网络模型的高级量化和压缩 技术的库。 通过合作推进AI模型效率研究 AI模型效率是至关重要的研究领域,在整个AI社区中具有同等重要的意义,以支持AI生态系统并大规模加速设备上AI的开发。 QuIC与其他AI研究人员合作创建了这个项目,增强了我们最新的模型效率研究,并为开源社区做出了贡献。QuIC致力于定期为该项目提供前沿研究。请加入我们,共同努力提高AI模型的效率。

    14610

    视觉对话的形态平衡模型(cs AI

    可视化对话任务需要一个模型来利用图像和对话上下文信息来生成对话的下一个响应。 我们证明,由于这个原因,先前joint-modality(历史和图像)模型过度依赖和更容易记住对话历史(例如,通过提取某些关键词或模式的上下文信息),而意象模型更可概括的(因为他们不能记住或从历史中提取关键字 因此,这个观察鼓励我们明确地维护两个模型,即纯图像模型和图像历史联合模型,并将它们的互补能力结合起来,得到一个更加平衡的多模态模型。 我们提出了多种方法来整合这两个模型,通过集成和一致的dropout融合与共享的参数。 根据经验,我们的模型在2019年可视化对话挑战中取得了优异的成绩(在NDCG上排名第三,在各项指标上保持了较高的平衡),并在大多数指标上远远超过了2018年可视化对话挑战的获胜者。

    32840

    AI小知识-基于模型的聚类

    类算法的分类——基于模型的聚类(model-based methods) ?

    31630

    AI初识境】深度学习模型评估,从图像分类到生成模型

    AP衡量的是学出来的模型在一个类别上的好坏,mAP衡量的是学出的模型在所有类别上的好坏。 首先要说Just-noticeable-distortion-model,简称JND模型,即恰可察觉失真模型,它建模人眼能够察觉的图像底层特征,只有超过一定的阈值才会被察觉为失真图像。 除此之外,还会考虑分辨率等,因此评价生成模型也需要从这几个方向着手。 不过Inception Score也有缺陷,因为它仅评估图像生成模型,没有评估生成的图像与原始训练图像之间的相似度,因此虽然鼓励模型学习了质量好,多样性好的图像,但是却不能保证是我们想要的图像。 An empirical study on evaluation metrics of generative adversarial networks[J]. 2018. 2019年有三AI培养计划已经开始

    63010

    DeepLearning.ai学习笔记(五)序列模型 -- week1 循环序列模型

    一、为什么选择序列模型 序列模型可以用于很多领域,如语音识别,撰写文章等等。总之很多优点。。。 二、数学符号 为了后面方便说明,先将会用到的数学符号进行介绍。 image.png ? 六、语言模型和序列生成 1.什么是语言模型 凡事开头举个栗子,一切都好说: 假设一个语音识别系统听一句话得到了如下两种选择,作为正常人肯定会选择第二种。但是机器才如何做判断呢? ? 此时就需要通过语言模型来预测每句话的概率: ? 3.构建语言模型示例 image.png ? image.png ? 3.计算出损失值 下图给出了构建模型的过程以及损失值计算公式。 ? 七、对新序列采样 image.png ? 下图给出了采样之后得到的效果: 左边是对训练得到新闻信息模型进行采样得到的内容; 右边是莎士比亚模型采样得到的内容。 ?

    590100

    机器学习能量模型:Facebook的AI主管LeCun所想象的AI未来

    据说有一些工程师和科学家,可以在他们的脑海中想象出那些尚未变成现实的构思,Facebook的AI主管Yann LeCun就是这种人。 LeCun在AI人群中是一个罕见的人物,他不仅精通算法设计,在计算机工程领域也有一定的建树。 为了使无监督学习成为可能,整个领域需要更多地研究一种方法——机器学习能量模型(energy-based learning)。 能量函数在AI领域已经存在了数十年。 “关于机器学习能量模型的想法已经有一段时间了,” LeCun说,“最近因为我需要减少监督学习算法的使用,所以又意识到了这一点。” 机器学习模型很容易学习案例中的细节,但是其基本思想是,不要创建大量带有标签的数据集(例如猫和狗的图片),也不用花费数千小时玩DeepMind的AlphaZero这样的国际象棋游戏,而只是获取一些丰富的原始数据

    34420

    Towhee 可视化工具,帮你理解AI模型

    AI 模型是怎么理解图片的? 幸运的是,Towhee[2] 不仅可以帮我们搭建一个 AI 业务工具,还能可视化 AI 模型内部的业务流程,能帮助我们更好的理解诸如深度学习这一类 AI 任务的运作原理。 所以,对神经网络模型的解释和可视化是一个很重要的工作,它能帮助我们直接观察模型内部的输出,加深对神经网络的理解,帮助定位问题改善模型。 总结 在 Towhee 的帮助下,我们不仅可以搭建一个 AI 业务工具,还可以探究这些工具背后的运作原理,以便于我们更容易去理解和解释深度学习任务。 Towhee: https://towhee.io/ [2] Towhee: https://github.com/towhee-io/towhee [3] captum: https://captum.ai

    8410

    干货 | 携程AI模型引擎设计与实践

    一、前言 近年来人工智能的发展成果在互联网行业得到了广泛的推崇和应用,各大巨头纷纷借助AI打造个性化、精细化服务, 加速扩张生态领域。 3、实时模型服务的开发周期长。实时模型服务离不开实时特征准备、业务逻辑开发、模型调用开发等步骤。 3、模型管理 模型管理模块主要实现了模型文件的上传、关联特征、模型发布、迭代回退等功能,对应了逻辑架构图中的模型管理一层。 结合携程的文件服务系统,算法工程师可以在模型管理模块便捷地上传模型。 在迭代模型时,为了减少再次测试、发布的环节,模型引擎平台支持算法工程师更替、回退模型文件,实现模型文件的实时生效。 然而随着预测业务精细化,在一些场景中,为了达到最优效果,会对模型进行进一步的细分,拆分出多个模型,这些模型的大部分业务逻辑和模型特征都相同,或者模型间存在着依赖关系,因此不适合将这些模型独立为各个场景。

    99820

    Edge2AI之CDSW 实验和模型

    在本次实验中,您将在 CDSW 中运行实验,选择产生最佳实验结果的模型并将该模型部署到生产环境中。 实验总结 实验 1 - CDSW:训练模型。 实验 2 - 部署模型。 实验 1 - CDSW:训练模型 在本实验和接下来的实验中,您将戴上数据科学家的帽子。您将编写模型代码,对其进行多次训练,最后将模型部署到生产环境。整个实验全部在30分钟内完成! /hadoop/conf/ 第 2 步:创建项目 返回主页并单击New Project,使用此 GitHub 项目作为源:https://github.com/cloudera-labs/edge2ai-workshop 第 2 步:部署模型 从项目的主页中,选择“模型”按钮。 等到模型部署完毕。这可能需要几分钟。 第 3 步:测试部署的模型 当您的模型状态更改为Deployed时,单击模型名称链接以转到模型的概览页面。

    14230

    最受欢迎的十大AI模型

    如上所述,人们需要清楚地了解每种类型的ML模型的优点,今天我们列出了10种最流行的AI算法: 1.线性回归 2.逻辑回归 3.线性判别分析 4.决策树 5.Naive Bayes 6. 所有机器学习模型旨在学习一些函数(f),它提供输入值(x)和输出值(y)之间最精确的相关性。Y = F(X) 最常见的情况是,当我们有一些历史数据X和Y时,可以部署AI模型以提供这些值之间的最佳映射。 逻辑回归 逻辑回归是另一种流行的AI算法,能够提供二进制结果。这意味着模型可以预测结果并指定y值的两个类别之一。该函数也基于改变算法的权重,但由于非线性逻辑函数用于转换结果的事实而不同。 深度神经网络 DNN是最广泛使用的AI和ML算法之一。 关于10种最流行的AI算法的最终思考 如您所见,有各种各样的AI算法和ML模型。有些更适合数据分类,有些则优于其他领域。没有适合所有应用的模型,因此选择最适合您的模型至关重要。

    4.3K40

    宇宙的奥妙,我用 AI 模型来探索

    该系统的创造者们也不知道深度密度偏移模型(D3M)是如何在没人教它运算方法的情况下模拟暗物质的变化的。 人工智能(AI)正在对天文学现象进行建模,比如:从超新星爆发到系外恒星周边的行星形成。 现在,研究人员借助AI的力量来对宇宙做整体建模,取得了令人惊讶的结果。正如人们所料,这个模型很快显示出它比以前的那些系统更加快速和准确。 然而,没有人训练D3M,这个AI却能够模拟当暗物质含量变化时宇宙的情景,这让研究者们困惑不已。 ? 把AI驱动的D3M模型与早期的2LPT方案进行对比,可以看到D3M比早期的那些模型都要快多得。在和一种较慢的仿真结果进行对比之后,这些图片显示了这两种较快的仿真之间的区别。 He等人/国家科学院学报2019 研究人员预料到他们的系统的速度和精度会超过以前的模型,他们没预料到的是AI能够推演未经训练的情形。

    29230

    扫码关注腾讯云开发者

    领取腾讯云代金券