首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度长文|百度Paddle Lite性能进化之路!

讲师根据自己多年的工作经验总结了PaddleGPU的7种优化手段:包含工作组动态划分、向量化操作、半精度计算、CPU逻辑分离、分支条件剪枝、数据结构选择和WinoGrad算法,其中重点介绍了分支条件剪枝...主要是在大多数体系结构,乘法的代价是要远大于加法,所以适当的增加加法而减少乘法,某种意义上可以获得一个全局的正向收益。...假设每一个层级有十倍的差异,当一些数据在计算器是miss状态时,想要在内存当中读取数据的话可能会受到上百倍的速度屏障。如何解决这个问题呢?接下来通过卷积运算被化简成矩阵乘法的例子来说明。...大家都知道模型有很多种,但是模型的基本组成算子是不变的,可以先对算子给出一个非常精准的基于真机的打分,根据算子的打分大概估算出模型打分,用这样的预估打分进行粗,经过粗后可能已经由上万个模型变为上百个模型...,这时候再利用真机给出基于真机的模型打分,这样就可以选出真正符合预期的模型了。

1.7K10

模拟到创新:人工智能从游戏中学到了什么?

(一)基于规则匹配的动作生成 1、基于状态机的动作生成 在虚拟环境,智能体的各种动作,如行走、跑步、跳跃、攻击等,被视为不同的状态。...图1 游戏中的状态示意图[5] 不难发现,该做法的优势在于能明确定义状态间的转换规则,例如行走状态可转变为跑步或跳跃;局限在于处理复杂的行为交互和预见未来的状态变化,可能有困难。...由于需要手写逻辑从一个节点跳到另一个节点,对于高度复杂的系统,状态机的设计和维护可能会变得极为复杂和费时。...该技术方案首先利用动作捕捉技术捕捉了22名人类职业足球运动员在比赛超过870万帧的动作数据,然后使用机器学习算法870万帧数据不断学习,最终实现游戏内智能体动作的实时生成。...图3 智能体动作生成技术示意图 腾讯逆战手游团队提出的这一套基于ARNN的动作生成技术解决方案,在业内实现了多个突破: 第一,为了落地自回归神经网络算法,研究人员零建立起完整的工具链,并通过动作捕捉、

19121
您找到你想要的搜索结果了吗?
是的
没有找到

模拟到创新:人工智能从游戏中学到了什么?

(一)基于规则匹配的动作生成1、基于状态机的动作生成在虚拟环境,智能体的各种动作,如行走、跑步、跳跃、攻击等,被视为不同的状态。...图1 游戏中的状态示意图[5]不难发现,该做法的优势在于能明确定义状态间的转换规则,例如行走状态可转变为跑步或跳跃;局限在于处理复杂的行为交互和预见未来的状态变化,可能有困难。...由于需要手写逻辑从一个节点跳到另一个节点,对于高度复杂的系统,状态机的设计和维护可能会变得极为复杂和费时。...该技术方案首先利用动作捕捉技术捕捉了22名人类职业足球运动员在比赛超过870万帧的动作数据,然后使用机器学习算法870万帧数据不断学习,最终实现游戏内智能体动作的实时生成。...图3 智能体动作生成技术示意图腾讯逆战手游团队提出的这一套基于ARNN的动作生成技术解决方案,在业内实现了多个突破:第一,为了落地自回归神经网络算法,研究人员零建立起完整的工具链,并通过动作捕捉、动画预处理

24020

KDD23 | 大厂推荐系统如何提升两阶段建模一致性

这两个工作虽然涉及到推荐系统的不同技术点,但是核心都是在处理大量样本的topK选择时,由于计算复杂度太高需要采用两阶段方式,第一阶段粗,第二阶段精排,但是第一阶段和第二阶段目标不一致,如何提升一致性进而提升整体效果的问题...这种两阶段方法,GSU阶段和ESU阶段存在不一致问题,即GSU筛选的打分和ESU筛选的打分并不是相同的计算逻辑,导致GSU筛选出的TopK不是全局最优解,可能在ESU认为最优的结果在GSU中被过滤掉了...重排位于精排之后,用来根据上下文信息,对精排产出的打分结果进行进一步矫正,提升点击率预估效果。...重排的核心是考虑上下文信息,重排的输入根据精排打分选择的topK个商品,输出是这topK个商品的某种排列组合,使得用户点击率最高。因此,整个过程是全部的排列组合,选择一个最优的排列组合。...对于某个排列组合,生成其表征向量,生成方式为使用预训练模型生成每个商品的表征,并结合当前排列组合下每个商品的位置编码,融合成一个统一的表征向量。

73831

CIKM 2019 挑战杯冠军方案分享:「初-精排」两阶求解框架

基本问题 根据历史用户-商品交互行为、用户属性和商品属性,对给定用户进行未来点击预测,选出该用户未来三天最可能点击的商品 top50;其中,在复赛需特别注意一点,即用户历史点击商品并不在未来可能出现的点击商品可选池中...更具体的,这个问题应该以 u-i 对为输入,经过一定模型的判断,最终给出一个 u-i 对对应的分数,再根据每个 user 对应的 u-i 对分数大到小的排序,取出 top50 的 item 作为最终得到预测点击商品集合...这两类偏好关系广泛存在与用户的历史行为,具体如图 2 所示;因此,如何合理捕捉这两类层次特征,是我们接下来算法的重点。 ? 图 2 层次偏好特征表达示意图 解决方案 ?...图 7 重要节点示意图 可以发现,通过引入层次结构特征,尤其是隐式层次结构特征的提取,我们对这一问题进行了较好的求解,结论上可以看出,结构特征确实对整个预测准确度带来了较大的性能提升,后续对结构特征信息做了特征交叉之后...本次冠军团队 WWG 的两位学生成员——孟宪令和焦宇航在阿里巴巴算法团队实习期间,参与了该比赛;比赛过程,团队负责人李朝博士,以及两位师兄潘旭明和邹朋成在算法的创新和思路上给予了一定的辅导。

87310

CIKM 2019 挑战杯冠军方案分享:「初-精排」两阶求解框架

(关于「用户兴趣高效检索」赛道冠军方案,我们也正在整理,敬请期待~) 赛题简介和分析 基本问题 根据历史用户-商品交互行为、用户属性和商品属性,对给定用户进行未来点击预测,选出该用户未来三天最可能点击的商品...更具体的,这个问题应该以 u-i 对为输入,经过一定模型的判断,最终给出一个 u-i 对对应的分数,再根据每个 user 对应的 u-i 对分数大到小的排序,取出 top50 的 item 作为最终得到预测点击商品集合...图 2 层次偏好特征表达示意图 解决方案 在接下来的算法,我们将基于类目的层次偏好称为显式层次偏好,将基于用户兴趣主题的层次偏好称为隐式层次偏好。...需要注意的是,在初赛历史商品也可能在未来曝光并被点击,所以历史商品无需特殊处理。而复赛阶段由于历史商品不会在未来曝光,所以复赛阶段在初阶段的结尾要对历史出现过的商品做筛除,以避免无效精排。...图 8 冠军获奖合影 关于冠军团队 本次冠军团队 WWG 的两位学生成员——孟宪令和焦宇航在阿里巴巴算法团队实习期间,参与了该比赛;比赛过程,团队负责人李朝博士,以及两位师兄潘旭明和邹朋成在算法的创新和思路上给予了一定的辅导

80050

如何提升推荐系统的可解释性?京东智能推荐卖点技术全解析

这里用到的特征都是离线提取出来的,召回是AI-flow的第一步,它根据用户和产品特征海量库存检索出少量可能感兴趣的物品,然后将他们传递给排序模块。...GBDT用于非线性排序,可以更好地特征捕捉非线性模式,逻辑回归用于线性特征排序;为了更好地捕捉动态数据分布,我们实施一种基于FTRL(McMahan2011)的在线学习策略来处理在线数据流。...卖点短文案的提取和生成 卖点短文案的提取和生成,主要包括卖点粗、卖点生成、卖点精这三个步骤。...文本输入表征包括了语义表征、segment表征(分割信息表征)、位置表征;最后将softmax层输出作为该文案的质量评分: image.png image.png image.png ② 卖点生成 由于粗选出的文案素材口语化...首先分别计算词库中选择字和输入中选择字的概率,然后再将词库的概率分布和输入的概率分布结合获得最终的概率分布。

1.1K01

【论文笔记】基于强化学习的句子摘要排序

文档的句子进行预测是否为候选摘要句子,并对所有句子进行打分,最后候选摘要句子中选出打分高的m个句子作为文档摘要。...由于ROUGE的计算公式是根据召回率进行改的,类比召回率可知,rouge=系统算法生成的摘要与参考摘要相同的N-gram数/参考摘要的N-gram总数。 为什么使用ROUGE作为评价指标呢?...针对这些问题,作者采用的训练策略不是最大化ground truth的似然,而是对文档的每个句子预测单一的rouge分数,然后选出分数最高高的m个句子组成摘要。...强化学习的五个要素:机器(Agent)、 状态、动作、环境、奖赏,具体而言:机器处在一个环境,每个状态为机器对当前环境的感知;机器只能通过动作来影响环境,当机器执行一个动作后,会使得环境按某种概率转移到另一个状态...;同时,环境会根据潜在的奖赏函数反馈给机器一个奖赏。

81250

RNAseq纯生信挖掘思路分享?不,主要是送你代码!(建议收藏)

预后模型在纯生信分析绝对有一席之地,本文简单的介绍下常见的预后模型构建的思路,详细的代码和使用场景见文中对应的推文链接 常见的分析思路可以是, (1)通过某种目的初步筛选出候选的基因集合(数目较多)...一 目的基因初 首先需要根据研究目的进行初步分析,比如入组的样本有哪些?分析的基因集是什么? 然后确定是通过分组计算DEGs 还是 找hub gene 来完成完成基因的初。...RNAseq|批量单因素生存分析 + 绘制森林图 2,基因筛选获取最终的模型基因 输入上述单因素预后显著的基因进行Lasso分析,筛选出 重点基因,构建预后模型并可视化RNAseq|Lasso构建预后模型...scRNA分析 | 解决可能的报错,0开始教你完成细胞通讯分析-cellphoneDB scRNA分析|使用CellChat完成细胞通讯分析-简单且可视化出众,代码自取 六 数据处理和可视化 1...(修正版) 数据处理|R-dplyr 2,可视化 可视化部分的话,多看一下具体特定函数的帮助文档,出现报错多使用??函数查看一下示例数据的格式 以及 函数等。

86751

干货:逻辑回归构建申请信用评级案例

作者 常国珍、吕鸿福 概述: 本文基于 R 语言,通过一个逻辑回归构建汽车贷款申请信用评级的案例,来为大家简单介绍信用风险模型及建模流程、R 语言实现、及中间需要注意的一些问题。...大家可以体会信用风险模型在实际生活、工作的应用场景。...本案例,我们构建申请信用评级模型的数据变量如下: 图2....下面给出一个比较通用的建模流程: 该流程总体可以分为五部分:建模准备→变量初→变量清洗→变量细与变量水平压缩→建模与实施,包含了收集数据到模型建立及实施的全流程。...,是因为我们在模型粗环节只挑选出5个最重要的变量进行建模;如若,在粗环节选择较多的变量,我们在下面流程可以进行变量细,如根据KS及IV值进行变量选择。

1.6K90

疫情下,人工智能与智慧医疗再次进入我们的视野

结合人工智能技术,能更快速、高效的开展新冠患者的查和诊疗工作;针对新型冠状病毒的新药研发也正在加紧运行,《柳叶刀》的最新研究就展示了利用人工智能筛选出的上市药物巴瑞替尼,可能对新冠病毒感染有效。...除了生物及医学领域的研究人员,可以说人工智能也加入了新冠患者的查和新药筛选的科研大军中。 医疗过程的人工智能应用 医疗过程主要产生如下表所示的两大类、四种数据。...在实际应用,把这些问题转化成分类、聚类或者回归问题进行处理。传统的方法有决策树、随机森林、支持向量机、K均值聚类、逻辑回归等。...面向多模态医疗数据的深度学习框架示意图 一些常用的网络如卷积神经网络、循环神经网络和一些经典算法如强化学习均被广泛应用于各种诊疗任务。...医疗机器人的智能性体现在能根据实际医疗需求独自编制操作计划、生成动作程序并加以实施。

54510

周杰伦在唱什么?数据可视化告诉你!

若你希望跳过数据预处理的过程,也可以在《数据可视化设计指南:数据到新知》一书的下载文件,直接使用分好词的 Excel 文件进行可视化练习。...在本案例,我们需要先从数据库选出演唱者为周杰伦的歌曲,然后获得这些歌曲的歌词,并将它们存储到纯文本文档(.txt 格式)。以下提供两种方法。...“分词词后导入”则支持用户粘贴长文本,然后由系统自动进行分词和词性判别。换句话说,如果你有一个文档文件,也可以直接粘贴进微词云进行分词。 接下来我们用周杰伦的歌词文档来尝试一下。...选择“分词词后导入”,然后将图1 的 .txt 格式的文档粘贴进微词云。之后,单击“开始分词”,软件就会自动把词语切割出来,并按词性归类,结果如图4所示。...同时,微词云还自动帮我们把高频的词汇勾选出来。我们也可以根据个人需求,在这个界面中进一步编辑,例如只显示名词、只显示动词等,然后单击“确定使用所选单词”按钮,即可生成词云。

69110

干货 | 携程新一代呼叫中心话务监控平台

,将监控项索引存储到Mysql DB; 故障检测:Hermes获取已采集的数据并调用数据分析模块进行故障检测; 数据分析:根据历史数据分析生成告警规则,检测当前数据,生成检测结果和告警信息; 告警聚合...; 系统逻辑图: ?...自动告警逻辑根据以上三个策略对实时的监控数据进行检测: 1、先进行跌零检测,如判断数据跌零且满足累计损失话务量或次数条件,则告警; 2、如果数据未跌零,则进行阈值分析和变化率分析,部分场景再结合累计影响话务量以及是否为节假日判断...图12:长期小幅下跌 七、告警查 告警检测依赖的是历史数据分析,而业务也有其随机性,因此不可避免的存在误告的可能。对此,我们采用自动测试方式对告警进行查。...针对话务量,成功率等监控项,获取疑似告警发生后,系统会调用“语音机器人”功能,根据测试用例进行自动测试,将测试结果返回后插入到告警信息,并告知运维负责人该告警为误告。 ?

1.6K40

陈宏申:浅谈京东电商商品文案挖掘难点与优化实践

电商商品文案挖掘的两大挑战 基于编码器解码器范式的序列文本生成模型可以用于文案挖掘,就是把商品的一些信息,例如标题、类别等进行模型投喂,然后直接拿某种类型的文案作为一个参考答案进行模型训练和学习。...总结来说,初模型就是要从大量不相关的文案词句中摘取一些相关的文案,文案生成模型就是把初模型摘取出来的结果进行总结和凝练,精选模型是要把初和凝练的结果同时再做一个筛选和把关,最终得到满足业务需求的结果...长文案相关的初模型是复用短文案的,以短词句形式来抽取文案素材,作为文案生成模型的输入。例如商品标题、商品属性信息的知识图谱、商品详情页和商品评论抽取出的词句片段,输入到文案生成模型。...该模型不需要严格地区分正例和负例,如果能百分之百严格区分的话,那么将得不到任何有效的结果,没法待清洗的词句中筛选文案词句;该模型是应该有差错的,正是这些差错才能最终筛选出有效结果,即一些和正例可能特别像的待清洗文案词句...Transformer可以标注的,比如四万个词或十万个词里面,去预测文案生成的每一个词串当中下一个词可能是哪个;而Pointer就是输入的,比如50个词或100个词猜,因此引入Pointer之后,文案生成的难度大大降低

1K30

【攻击意图评估:序】误报太多?谈海量告警筛选

如何能够如此之多的防护告警快速筛选出有价值的关键告警,是企业信息安全建设过程无法逃避的问题之一。 二、防护告警的构成 在讨论告警筛选问题之前,我们需要先弄清楚防护告警的实际构成。...,要么错很多,要么漏都很多。...在大规模攻防对抗,一个防守节点确认到攻击并共享信息后,其它节点的防守方常常会根据恶意IP(攻击源、C&C控制端、矿池地址等)搜索历史告警,并将恶意IP加入ACL黑名单以绝后患。...实验表明,很多关键告警确实都会被算法判断为异常,但被算法判断为异常的,却并不都是关键告警——异常检测结果包含大量由于业务逻辑独特、网络结构独特等各种原因导致“不正常”的告警。...某种意义上,这表明现有的防护系统是存在缺陷的——防护系统根据原始流量产生告警的过程,可能损失了某种关键信息,而这种信息恰恰能够反映告警的实际重要程度。

3.1K40

一次找出范围内的所有素数,埃式法是什么神仙算法?

埃式法 我们今天要介绍的埃拉托斯特尼算法就是他发明的用来筛选素数的方法,为了方便我们一般简称为埃式法或者法。埃式法的思路非常简单,就是用已经筛选出来的素数去过滤所有能够被它整除的数。...这些素数就像是筛子一样去过滤自然数,最后被剩下的数自然就是不能被前面素数整除的数,根据素数的定义,这些剩下的数也是素数。...举个例子,比如我们要筛选出100以内的所有素数,我们知道2是最小的素数,我们先用2可以掉所有的偶数。然后往后遍历到3,3是被2剩下的第一个数,也是素数,我们再用3去筛除所有能被3整除的数。...我们来分析一下法的复杂度,代码当中我们可以看到,我们一共有了两层循环,最外面一层循环固定是遍历n次。...实际上是可以的,根据素数分布定理以及一系列复杂的运算(相信我,你们不会感兴趣的),我们是可以得出法的复杂度是。

1K20

2020年,知识图谱都有哪些研究风向?

它需要在标准的文本生成方法的基础上使用额外的逻辑。...Reward」中提出了 ASGARD,利用根据某个文档构建的知识图谱改进了文本生成过程。...图 14:带有文档级图编码的 ASGARD 框架示意图。 具体而言,编码器由两部分组成。 步骤 1:他们使用 RoBERTa 对输入段落进行编码。...最后一层嵌入会被输入给一个双向 LSTM,从而获得隐藏状态。 步骤 2:他们使用 OpenIE 提取三元组,输入文档中导出一张图。...完形填空的部分包括根据人类编写的摘要提取 OpenIE 图,并基于它们生成完形填空风格的问题,以便系统更好地了解摘要文档的含义。所以从某种程度上说,这里面也包含了一个问答系统模型。

1.6K30

Kubernetes Pod资源调度概述

1、调度概述 Kubernetes API Server接受客户端提交Pod对象创建请求后的操作过程,有一个重要的步骤是由调度器程序kube-scheduler当前集群中选择一个可用的最佳节点来接收井运行它...创建Pod对象时,调度器scheduler负责为每一个未经调度的Pod资源、基于一系列的规则集集群挑选一个合适的节点来运行它,因此它也可以称作Pod调度器。...调度过程,调度器不会修改Pod资源,而是从中读取数据,并根据配置的策略挑选出最适合的节点 ,而后通过API调用将Pod绑定至挑选出的节点之上以完成调度过程。 ?...执行预选操作时,调度器将对每个节点基于配置使用的预选策略以特定次序逐一查,并根据一票否决制进行节点淘汰。...如上的各预选策略,CheckNodeLabelPresence和CheckServiceAffinity可以接受特定的配置参数以便在预选过程融合用户自定义的调度逻辑,这类策略也可称为可配置 策略,而余下那些不可接受配置参数的策略也统一称为静态策略

1.2K30

Elasticsearch 在地理信息空间索引的探索和演进

暴力算法 中心坐标点依次跟集合每个坐标点计算距离,筛选出符合半径条件的坐标点。这个算法大家太熟悉了,就是最常见的暴力(Brute Force)算法。...第二步: 根据倒排表得到的docId和词频信息对文档进行打分,返回给用户分值最高的TopN结果。...就是用来控制每个数值字段在分词是生成term的数量,生成term数量越多,区间控制粒度越细,占用磁盘空间越大,查询效率通常越高。...它是分别获取符合纬度范围条件的文档集合和符合经度范围条件的文档集合然后进行交集,初了太多无效的文档集合。...第三步: 当满足如下任一条件时,将相关的文档集合收集起来,作为第一批粗的结果。 条件一:切分到正好跟前缀的precisionStep契合,并且quad-cell在矩形内部时。

1.3K30

当你处理了几千万数据之后...

在实际的应用开发,要特别注意筛选出对数据延迟零容忍的的业务逻辑,结合实际,应用主节点进行数据查询或者其它手段来保障数据的强一致性需求。...什么时候开始?影响是什么? 限定业务逻辑范围,影响的数据面,比如,粉丝+好友+群组关联的数据群,A关注了B,A多了一个好友,B多了一个粉丝,A把B放在了特定的群组里。...限定时间范围:什么时候开始上线了或者什么时候触发了有问题的业务逻辑,比如,对 X 对象的变更修改调整起始于 1 号,那么就需要查找所有 1 号至今的所有与 X 对象修改相关的活动数据。...限定影响:确定对数据的影响是什么,才能进一步决定下一步怎么处理,比如漏掉了一个属性赋值,那么是否可以根据其它状态属性进行修正?改删除的数据没有删除,是否直接删除就能解决问题?...这里,需要指出的是,不同量级的数据的处理查方式上会有所区别。

38230
领券