头部自动驾驶公司已经从Demo阶段开始迈入了量产阶段,在自动驾驶重型卡车的量产之路上,对车载的软件系统和硬件平台都提出来很高的要求。如何在受限的资源平台上,不断提高算法和模型的精准度,不断优化系统的性能和稳定性,是一个非常大的挑战。本期沙龙,DataFun邀请智加科技的5位技术专家,将为您就自动驾驶各个模块做深入的技术分享。
来源:火山引擎 DataFun 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
来源:火山引擎 & DataFun 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
来源:金融壹账通 & DataFUN 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
来源:火山引擎 DataFun 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
竹间智能 & DataFun Talk人工智能技术沙龙 ——基于情感情绪识别的对话式AI及应用实践
来源:虎牙 & DataFun 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷 📷
“ 本文是对刘鹏和王超老师著作的《计算广告》一书阅读后,整理的学习笔记。内容包含:概述,系统架构,定向广告,在线广告,EE算法等。如有不当,欢迎指正。”
“围剿”黑产,揭秘O2O、电商和互联网金融的大数据风控之道
本文是对刘鹏和王超老师著作的《计算广告》一书阅读后,整理的学习笔记。如有不当,欢迎指正。
2022年3月26日,DataFun将联合腾讯大数据及其他平台举办第二届线上DataFunSummit:大数据存储架构峰会。 本次峰会全面升级了各论坛设置,覆盖面更广,将由6位主席,联合7位出品人,邀请业界50余位一线技术专家出席并进行主题报告分享。届时腾讯大数据平台数据中心副总监—罗韩梅,将会以峰会主席的身份参与,诸多腾讯大数据资深技术专家也将会带来各自的自研分享,敬请期待! 本次峰会开放直播报名入口,大家只需关注腾讯大数据公众号,点进主页即可免费预约观看,3月26日,腾讯大数据与你一同见证精彩! ▌大
含有大量观测数据的情况下,可以使用各类合成A/B的方式,包括matching、合成控制等
6月11日9点,腾讯大数据将联合DataFun举办:多维分析架构峰会。腾讯数据平台部总监陈鹏将担任峰会的荣誉主席,计算平台组负责人陈奕安将担任峰会的主席。 本次峰会共设置9大主题论坛,来自腾讯的技术专家龙跃将担任新一代 MPP 数据库架构论坛出品人并作《腾讯新一代多维分析引擎MercsDB》主题分享。本次峰会精彩纷呈,内容上既涵盖了开源多维分析、新一代MPP数据库架构、数据湖分析型架构、实时多维分析等核心技术,也包含金融、互联网、交通、物流、工业、画像、营销等多个应用场景的实践经验。 感兴趣的朋友欢迎预约直
7 月 9 日,13:30 - 17:15,腾讯大数据联合DataFun举办的《数据安全与隐私计算峰会》将会在视频号开启直播,由腾讯 Angel PowerFL 隐私计算平台负责人程勇老师出品的「广告推荐与隐私计算论坛」,将邀请来自腾讯、浙江大学、百度、华为、OPPO的5位专家学者,针对广告推荐场景下隐私计算的技术发展趋势和应用实践进行深度分享,欢迎大家一起探讨交流。 出品人:程勇 腾讯 Angel PowerFL 隐私计算平台负责人 腾讯 Angel PowerFL 隐私计算平台负责人,中国专利审查技
1. 《 深度学习 》 作者: [美] 伊恩·古德费洛 / [加] 约书亚·本吉奥 / [加] 亚伦·库维尔
智能时代如何构建金融反欺诈体系?
人工智能时代,一项新技术的诞生、应用和落地,幕后都离不开这样的一群先行者: 在未知的领域不断的试错,不停的迭代,解决各种问题。这些幕后的故事大多鲜为人知。 2018 AI先行者大会 这一次,先行者们从幕后到台前, 为大家带来业内最新的技术及应用落地:云计算与大数据、机器学习ML、自然语言处理NLP…… 腾讯小知智能客服算法负责人也受邀参与此次大会,和大家交流分享他在AI探索道路上走过的弯路和解决办法! 大会详情: 时间:2018年9月16日 地址:浙江东方豪生大酒店 | 杭州 主办方:AICUG、IT大咖
人工智能时代,如何做好内容审核和流量反作弊?
今天分享的内容分为两部分,第一部分是搜索广告和广告召回。我会介绍搜索广告的业务逻辑,以及召回模块的逻辑。第二部分是语义相关和深度学习,这部分会介绍语义相关的计算方法以及使用的深度学习模型。
大家好,今天想和大家讨论下相关推荐技术通用的特点及在实践中的改进点,这也是我们团队在研发实践中一些经验总结。
智能风控已经被提及了很多年,在业界也有诸多应用实践,但是,智能风控相关书籍中,能够阐述完整智能风控体系,将智能风控各个环节融会贯通并结合实际案例的还是凤毛麟角。经过十余年的沉淀,蒋宏老师以及他的团队将智能风控的核心方法、流程和应用实践整理成书籍出版,相信能够帮助到智能风控领域的从业者。
[ 导语 ] 2022年3月26日,DataFun联合腾讯大数据及其他平台举办的第二届线上大数据存储架构峰会已经完美收官落幕。当日,腾讯大数据作为主办平台之一,分享了诸多自主研发的产品,给大家剖析了其中的技术原理以及运用场景。俗话说,温故而知新,那么今天,应诸位小伙伴的呼声和要求,我们就一起来复习一下当日腾讯大数据平台各位老师们的精彩分享吧! ▍腾讯Alluxio—加速新一代大数据与AI变革 陈寿纬 | Alluxio OS核心工程师 罗格斯大学计算机博士 毛宝龙 | 腾讯 Alluxio Oteam
在开源大数据技术飞速发展的十数年,我们见证了多元化技术的兴起和变迁。如何从海量数据中,通过数据处理和可视化的手段,对开源大数据技术的过去、现在和未来,做出深刻洞察?如何为开发者在开源大数据技术领域的学习、选型和技术研发提供有益参考?带着这样的思考,开放原子开源基金会、X-Lab 开放实验室、阿里巴巴开源委员会共同发起了「2022 开源大数据热力报告」项目, InfoQ 作为战略合作伙伴参与其中。 项目简介 「2022 开源大数据热力报告」收集相关公开数据进行关联分析,通过 Star、Issue、open
推荐系统的目标主要包含两个方面:Exploitation 和 Exploration 。
效果: 前台分页 区别于后台分页的将第几页和共多少条传到后台,再从后台从数据库查询出当前页应该显示的数据返回 前台分页是将所有的数据都查出存到前台,在经过用js进行判断,分页,显示 HTML代码:
说到推荐系统,最经典的就是协同过滤,上图是一个协同过滤的例子。协同过滤主要分为俩种:user-based 基于用户的协同过滤和 item-based 基于商品的协调过滤。
现代商业竞争已经从渠道、资源向系统整体效率倾斜,而效率的竞争很大程度上来自于数据能力的支撑。 当我们从数据平台方的视角出发会发现演进路上存在着诸多挑战,比如: 1. 数据领域的生态非常庞大,针对不同场景在资源、数据规模、时效的权衡下会衍生出不同的架构和组件,以及随之带来的团队碎片化,设备资源的重复投入,数据一致性的焦虑,技术选型的困难和迁移的潜在风险; 2. 在伴随业务扩张的过程中,如何平滑而透明地解决伸缩性,用好自建以及混合多云资源;如何建设一站式多租户的数据工具链,在开发生产以及租户之间做好共享和隔离的
随着湖仓技术的持续演进,数据仓库和数据湖方案在快速演进和弥补自身缺陷的同时,二者之间的边界也逐渐淡化,湖上建仓、仓中数据降冷到湖、物化视图、冷热融合查询等方案也越来越多的成为各个公司的标配,各大厂商也陆续提出了自己的湖仓融合方案,通过湖仓融合技术来提升业务使用体验的同时也降低了业务的使用成本。
外卖刷单用户与商户要注意了!大数据风控来了!
经过近两个月的评审,2018中国AI英雄风云榜年度人物榜单昨日揭晓,10位人工智能领域的从业者获奖。
FM 模型最早由 Steffen Rendle 在2010年提出,解决了稀疏数据场景下的特征组合问题,在广告、推荐等领域被广泛使用。FM 模型简单而且效果好,可以作为业务初期快速取得收益,为后续持续迭代提供一个较强的 baseline 。FM 模型从首次提出到现在已经过去七八年时间,这期间的研究进展如何呢?比如:
在过去的2021年里,社区正式推出了 0.12 系列版本,并在 0.12 版本上维护了 0.12.0 - 0.12.4 共计 5 个小版本。我们将精打细磨,力求持续地为大家提供性能稳定、速度极致的体验。
导读:本次分享的主题为推荐系统中模型训练及使用流程的标准化。在整个推荐系统中,点击率 ( CTR ) 预估模型是最为重要,也是最为复杂的部分。无论是使用线性模型还是当前流行的深度模型,在模型结构确定后,模型的迭代主要在于特征的选择及处理方面。因而,如何科学地管理特征,就显得尤为重要。在实践中,我们对特征的采集、配置、处理流程以及输出形式进行了标准化:通过配置文件和代码模板管理特征的声明及追加,特征的选取及预处理等流程。由于使用哪些特征、如何处理特征等流程均在同一份配置文件中定义,因而,该方案可以保证离线训练和在线预测时特征处理使用方式的代码级一致性。
导读 DataFunCon是由DataFun主办的线上技术大会,由20余位知名专家学者出品,设置了18场专题分享,有超过80位一线资深技术专家参与分享,汇集了2020大数据、AI领域最新技术实践。本次大会将于7月25-26日,9:30-18:00在线上举行。 7月26日,9:00-12:20,由腾讯大数据智能学习团队负责人陶阳宇先生担任出品人的DataFunCon:AI 平台/框架论坛将准时开启,感兴趣的小伙伴和小编一起来了解下吧: 详细介绍: 出品人:陶阳宇 博士 腾讯大数据 | 智能学
本文首先介绍了强化学习的概念和相关知识,以及与监督学习的区别,然后就强化学习在自然语言处理应用中的挑战和优势进行了讨论。
从18年11月开始,接触推荐系统半年左右时间,对推荐系统有了基本的认识。相比于之前做的 nlp 任务,推荐系统复杂更多,数据来源更复杂、pipeline 更复杂、场景更复杂、业务更复杂、指标更复杂。在 NLP 部分的时候,绝大多数时间花在了数据-模型以及其 match 上。而在推荐里由于系统复杂度提升,多了更多的功夫在系统架构、代码重构、快速部署上,工程侧的东西在复杂系统中显得更为重要。秉着精益算法的思想,延续之前的系列,这里我结合自己的经验,给大家分享下如何快速的搭建一个不错 baseline 的推荐系统。请各位吸取精华、去其糟柏即可。
导读:本文转载自 DataFun 社区,分享题目为《如何在因果推断中更好地利用数据?》,主要介绍团队近期在因果上已发表论文的相关工作。本报告从两个方面来介绍我们如何利用更多的数据来做好因果推断,一个是利用历史对照数据来显式缓解混淆偏差,另一个是多源数据融合下的因果推断。
导读:本次分享的主题为人机对话技术研究进展与思考。主要梳理了我们团队近两年的工作,渴望可以通过这样的介绍,能给大家一个关于人机对话 ( 包括它的科学问题和应用技术 ) 方面的启示,帮助我们进行更深入的研究和讨论。主要包括:
导读:阿里妈妈是阿里巴巴集团旗下数字营销的大中台,2018年广告营收超过1500亿,近乎占据中国广告市场收入的半壁江山。如何驱动这艘商业航母不断前行,阿里妈妈技术团队始终坚持技术创新驱动业务增长的战略,而 TDM 正是在这一战略指导下,由阿里妈妈精准定向广告算法团队自主研究、设计、应用从而创造巨大商业价值的创新算法典型代表。
导读:本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分:
今天分享的内容主要分为四个部分,首先会介绍下严选实时数仓的背景、产生的一些问题。然后是针对这些背景和问题对实时数仓的整体设计和具体的实施方案,接着会介绍下在实时数仓的数据质量方面的工作,最后讲一下实时数仓在严选中的应用场景。
本文首先介绍了什么是旅游知识图谱,然后就旅游知识图谱的架构,构建,应用和未来几个方面展开讨论。
Doris 是分布式、面向交互式查询的分布式数据库,主要部分是 SQL,内部用到 MPP 技术。
Arrow是高性能列式内存格式标准。它的优势:高效计算:所有列存的通用优势,CPU缓存友好、SIMD向量化计算友好等;零序列化/反序列化:arrow的任何数据结构都是一段连续的内存,在跨进程/跨及其传输数据时直接发送/接收整段内存即可,不需要序列化和反序列化;完善的数据类型和生态;支持跨语言跨系统互操作。
vSAN常见故障排错:1. vSAN架构回顾、2. vSAN创建VM全过程介绍、3. vSAN排错方法论、4. vSAN常用排错工具、5. 总结与回顾
导读大家好,这里是 NewBeeNLP。今天分享百度最近在NLP预训练的探索,并在下游任务的一些实践。主要又一种适用于低资源的预训练方式,以及在自然语言理解、自然语言生成、向量表示的零样本推理应用。
导读:Elasticsearch是一个分布式的搜索和分析引擎,可以用于全文检索、结构化检索和分析,并能将这三者结合起来。Elasticsearch基于Lucene开发,现在是使用最广的开源搜索引擎之一。Elasticsearch可以应用于在/离线日志流水、用户标签画像、数据库二级缓存、安全风控行为数据、图数据库索引、监控数据、Wiki文档检索等应用场景。58同城有自己的主搜,而一些内部创新搜索业务和大规模的数据实时OLAP ( On-Line Analytical Processing,联机分析处理 ) 则是使用Elasticsearch。
大家好,这里是NeeNLP。今天我们分享来自快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开:
本次分享主题主要从以下是三个方面展开:1. 知乎推荐页场景和Ranking历程介绍;2.深度学习在Ranking中的尝试和应用现状;3.Ranking面临的问题和未来研究方向。
采访 & 撰稿 | Natalie 嘉宾 | 陈松坚 编辑 | Vincent 导读:腾讯小知是腾讯云旗下自主研发的,为企业级客户打造的24小时在线智能客服机器人系统。小知将腾讯大数据AI团队积累的高尖人工智能技术融入到客户沟通、智能服务、服务管理和商业决策各环节,打造客户服务闭环,大大提升客服效率。 腾讯小知的推出无疑是给市场注入了新的血液,但智能客服 / 问答产品的市场竞争一直非常激烈,很多公司都尝试在不同的垂直领域开发智能客服产品。在 Reddit 上,有观点认为,NLP 领域的突破状况令人失望,近
领取专属 10元无门槛券
手把手带您无忧上云