首页
学习
活动
专区
工具
TVP
发布

腾讯技术工程官方号的专栏

专栏成员
1119
文章
2586502
阅读量
907
订阅数
由浅入深了解机器学习和GPT原理
我不是一个机器学习专家,本来是一名软件工程师,与人工智能的互动很少。我一直渴望深入了解机器学习,但一直没有找到适合自己的入门方式。这就是为什么,当谷歌在2015年11月开源TensorFlow时,我非常兴奋,知道是时候开始学习之旅了。不想过于夸张,但对我来说,这就像是普罗米修斯从机器学习的奥林匹斯山上将火种赠予人类。在我脑海中,整个大数据领域,以及像Hadoop这样的技术,都得到了极大的加速,当谷歌研究人员发布他们的Map Reduce论文时。这一次不仅是论文,而是实际的软件,是他们在多年的发展之后所使用的内部工具。
腾讯技术工程官方号
2023-07-15
3870
“太极”助力,腾讯广告如何借大模型降本增效?
更低成本、更优效果,也就是“降本增效”,是所有广告投放追求的目标。广告技术的发展正让“降本增效”越来越具体、越来越可以量化和感知,比如目前互联网广告平台开始以 GMV(成交金额)或 ROI(投入产出比)为营销效果的评估标准。 一次更高效的广告投放,本质上是在合适的场景,让对的广告出现在对的人面前。这离不开广告平台对广告内容和用户群体的深刻理解,并在他们之间达成更准确的匹配。 腾讯广告已经为此交出了一份答卷:首先,以国际领先的混元 AI 大模型助力系统深刻理解广告内容,其次以精排大模型提升广告和用户的匹配准确
腾讯技术工程官方号
2022-06-24
6420
TencentOCR 斩获 ICDAR 2021 三项冠军
作者:TencentOCR团队 全球 OCR 最顶级赛事,TencentOCR 以绝对领先优势斩获三冠,腾讯技术再扬威名! 一、竞赛背景 2021 年 9 月,两年一届的 ICDAR 竞赛落下帷幕,这是文字识别(OCR)领域全球最顶级赛事。TencentOCR 团队在本届比赛中参加了视频文字识别竞赛,并包揽该赛道全部 3 项冠军,成绩遥遥领先。这也是继 2017 年团队勇夺 4 项官方认证冠军[1]、2019 团队勇夺 7 项冠军后[2],再创佳绩,同时也标志着腾讯 OCR 技术稳居国际第一流水准。
腾讯技术工程官方号
2021-11-05
1.1K0
神经网络可视化,真的很像神经元!
不知道大家有没有这种感觉?在接触AI时,老感觉神经网络就像个黑盒子,摸不着,看不透,贼神秘了。 其实,神经网络就是对人脑运作模式的智能模拟。和人脑一样,神经网络模型的强大能力,是基于成千上万个神经元的相互作用。以卷积神经网络(CNN)为例,其结构就分为很多层,层与层之间通过线来连接。训练的过程,就是将所有的线设置成合适的值的过程。 为了直观展示,今天就通过可视化带大家看看AI训练时都长啥样。(前方多图预警! 首先,AI模型训练前长这样: 训练中,依次经过卷积-激活、卷积-激活-池化、卷积-激活、卷
腾讯技术工程官方号
2021-04-29
1.3K0
数据分析利器:XGBoost算法最佳解析
作者:symonxiong,腾讯 CDG 应用研究员 XGBoost是一种经典的集成式提升算法框架,具有训练效率高、预测效果好、可控参数多、使用方便等特性,是大数据分析领域的一柄利器。在实际业务中,XGBoost经常被运用于用户行为预判、用户标签预测、用户信用评分等项目中。XGBoost算法框架涉及到比较多数学公式和优化技巧,比较难懂,容易出现一知半解的情况。由于XGBoost在数据分析领域实在是太经典、太常用,最近带着敬畏之心,对陈天奇博士的Paper和XGBoost官网重新学习了一下,基于此,本
腾讯技术工程官方号
2020-12-28
1.9K0
腾讯AI Lab语音技术中心应用与研究介绍
“CCF语音对话与听觉专业组走进企业系列活动”第十期之“走进腾讯”研讨会于上周六圆满闭幕,本次研讨会由上海交通大学钱彦旻副教授主持,并邀请到四位专家介绍腾讯语音及对话领域的最新成果,分别是: 腾讯AI Lab语音技术中心副总监苏丹博士,腾讯AI Lab资深算法专家卢恒博士,腾讯语言算法专家黄申博士,腾讯多媒体实验室高级总监商世东。 其中,腾讯 AI Lab语音技术中心副总监苏丹博士作了题为《腾讯AI Lab语音技术中心应用与研究介绍》的学术报告,主要介绍了腾讯AI Lab语音技术中心的主要应用落地,分
腾讯技术工程官方号
2020-09-14
2.8K1
腾讯 AngelFL 联邦学习平台揭秘
作者:AI前线 数据里蕴含着价值。在人工智能时代,机器学习尤其深度学习模型的获得需要大量的训练数据作为前提。但是在很多业务场景中,模型的训练数据往往分散在各个不同的业务团队、部门、甚至是不同的公司内的。由于用户隐私,这些数据无法直接使用,形成了所谓的“数据孤岛”。近两年,联邦学习技术 (Federated Learning)迅速发展,为跨团队数据合作,打破“数据孤岛”提供了新的解决思路,并开始从理论研究迈向批量应用的落地阶段。本文系统的介绍了联邦学习的发展历程以及业界情况,并重点介绍了TEG数据平台
腾讯技术工程官方号
2020-03-19
3.6K0
揭秘微信「扫一扫」识物为什么这么快?
作者:arlencai,腾讯 WXG 应用研究员 微信“扫一扫”识物已上线一段时间,在公司内外均受到极大的关注。相比于行内相关竞品的“拍”,“扫一扫”识物的特点在于“扫”,带来更为便捷的用户体验。“扫”离不开高效的移动端物体检测,本文将为你揭秘。 一、背景 “扫”是“扫一扫”识物的亮点,带来更为便捷的用户体验。相比于“拍”的交互方式,“扫”的难点在于如何自动地选择包含物体的图像帧,这离不开高效的移动端物体检测。 二、问题 “扫一扫”识物是一种面向开放环境的通用物体检测——复杂多样的物体形态要求模型具有
腾讯技术工程官方号
2020-03-03
3.4K0
一种全新的点击率建模方案
本文作者:branxu,腾讯 CDG 应用研究员 2018 年和 2019 年腾讯算法广告大赛都可以看做推荐系统问题。这类问题最重要的特征是点击率,最大的难点是冷启动。文本结合 2018 年比赛亚军方案和 2019 年比赛冠军方案中的一部分技巧,提出了一种新的点击率建模方案,试图解决一部分冷启动问题。该方案复杂度很低,实现简单,效果好。 问题介绍 推荐系统和广告算法中,对于新用户或者新内容,记录很少,如果我们直接将历史点击率作为特征,会存在问题。比如 1,新用户 A 有 2 条浏览记录,1 次点击
腾讯技术工程官方号
2020-02-10
1.4K0
内容 AI:建立统一的跨媒体多模态内容理解内核
作者:zixunsun@tencent.com Jeff Dean 谈 2020 年机器学习趋势:多任务和多模式学习将成为突破口 2019 年下半年,CDG 广告、 CSIG 音视频,IEG 内容推荐、PCG 信息流、TEG 数平广告推荐和 AI 平台部团队、WXG 看一看团队内容技术专家沟通,大家在处理内容理解任务时候,都有融合多模态特征进行内容理解需求,同时大家具有很好的技术能力和研发经验。 我们希望能建立统一的跨媒体多模态内容理解内核,对新增内容理解任务,快速完成 0-1 步积累,提升模型实
腾讯技术工程官方号
2020-01-10
4.8K1
鹅厂开源先锋,日均计算量超30万亿,全力打破数据墙
开源,开源,开源。 这就是腾讯2019年技术领域最直观的变化。 最新代表事件,来自于腾讯首个开源的AI项目Angel,完成3.0版本进化后,得到全球技术专家认可,从开源基金会LF AI毕业,成为业内顶级AI开源项目。 这是中国首个得此认可的项目,消息传来自是引发好评热议。不过,这只是腾讯过去这一年开源成绩的注脚之一。 过去一年,腾讯开源势头愈发凶猛。截止12月份,对外开源项目超过92个,覆盖所有BG(事业群),微信、腾讯云、大数据、游戏、AI、安全等业务都在其中,累计获得超27万标星,赢得一片赞
腾讯技术工程官方号
2020-01-08
5530
NeurIPS 2019|腾讯AI Lab详解入选论文,含模仿学习、强化学习、自动机器学习等主题
感谢阅读腾讯 AI Lab 微信号第 89 篇文章。本文将解读腾讯 AI Lab 入选 NeurIPS 2019 的 14 篇论文。 第 33 届神经信息处理系统大会(NeurIPS 2019)将于当地时间 12 月 8 – 14 日在加拿大温哥华举办。该会议的目标是促进有关神经信息处理系统的生物学、技术、数学和理论方面的研究交流。伴随着人工智能与机器学习领域的飞速发展,作为领域顶级学术会议之一的 NeurIPS 今年会议的论文投稿数量又创造了新的记录:本届会议共收到有效提交论文 6743 篇(相比去年增
腾讯技术工程官方号
2019-12-18
9020
机器学习模型可解释性的详尽介绍
模型可解释性方面的研究,在近两年的科研会议上成为关注热点,因为大家不仅仅满足于模型的效果,更对模型效果的原因产生更多的思考,这样的思考有助于模型和特征的优化,更能够帮助更好的理解模型本身和提升模型服务质量。本文对机器学习模型可解释性相关资料汇总survey。 综述 机器学习业务应用以输出决策判断为目标。可解释性是指人类能够理解决策原因的程度。机器学习模型的可解释性越高,人们就越容易理解为什么做出某些决定或预测。模型可解释性指对模型内部机制的理解以及对模型结果的理解。其重要性体现在:建模阶段,辅助开
腾讯技术工程官方号
2019-10-28
2.2K0
腾讯大数据星火计划--Angel技术沙龙 对外报名正式启动!
导语:腾讯大数据举办星火计划技术沙龙为广大大数据爱好者提供线下交流活动机会,技术沙龙第一期将于10月13日在深圳腾讯大厦举办,为您揭秘海量机器学习之道与Angel开源背后的故事。 大数据技术在过去10多年中改变了企业对数据的存储、处理和分析的过程,如今的大数据技术栈逐渐成熟并涵盖了计算、存储、数仓、数据集成、NOSQL、OLAP分析、机器学习与数据科学等丰富的内容。在未来的发展方向上,大数据技术还会在引擎容器化、大数据机器学习、数据湖等方面不断延伸。 为了让大数据爱好者们可以了解腾讯在大数据领域的
腾讯技术工程官方号
2019-10-08
7920
大牛书单 | 人工智能方向好书分享(第二期)
导语:读书是一生的功课,技术人通过读书实现自我提升,学习优秀知识沉淀。腾讯TEG读书会本期特邀腾讯AI Lab语音识别中心副总监苏丹、腾讯AI医疗中心病理和治疗团队负责人韩骁、腾讯AI Lab专家研究员赵沛霖为大家带来人工智能方向好书推荐第二期。来看看技术大牛在读什么,收藏优质内容,愿本期书单助您更专业。 AI Lab语音识别中心副总监,17年加入公司,从事语音研究多年。 《Pattern Recognition and Machine Learning》 作者:Christopher M. Bi
腾讯技术工程官方号
2019-09-11
1.2K0
一文读懂数据库最新技术趋势:TDSQL带你深度纵览VLDB 2019
一年一度的数据库领域顶级会议 VLDB 2019 于当地时间8月26日-8月30日在美国加利福尼亚州洛杉矶召开。来自学术界和工业界的参会者们汇聚一堂,共襄盛会,探讨交流数据库领域最前沿的技术和发展方向。 在本届大会上,腾讯公司与中国人民大学、新加坡国立大学合作,投中 Industry Paper 两篇。其中 TDSQL 团队的论文工作“A Lightweight and Efficient Temporal Database Management System in TDSQL”,介绍了基于分布式
腾讯技术工程官方号
2019-09-05
1.5K0
微服务架构系列二:密码强度评测的实现与实验
本文是继《微服务架构系列一:关键技术与原理研究》的后续,系列一中论述了微服务研究的背景和意义,主要调研了传统架构的发展以及存在的问题和微服务架构的由来,然后针对微服务架构的设计原则、容器技术、服务发现、通信机制、持续集成等方面进行了分析与研究,并简单讲述了谷歌Kubernetes的相关组件和原理。系列二依据系列一中讲述的相关技术,进行了业务原理分析和建模,然后一步步实现了基于机器学习的密码强度评测服务,搭建相关环境并部署编排服务和进行了相关验证,最后对微服务架构设计进行了总结和展望,并简单概述了后续系
腾讯技术工程官方号
2019-08-16
1.3K0
经典机器学习 | 如何做到预流失与流失挽回?
导语:预流失用户,即有流失倾向,但还没有开始真正流失的用户。相较于流失用户而言,预流失用户处于观望阶段,或许对现有产品有所顾虑,或许对于潜在的流向(竞品)有所顾虑,或许是在等待些什么;流失用户,即已经流失了的用户,或许是因为游戏弃坑,或许选择了其他产品,用户肯定还在玩些什么,只是不再来你这儿了。文章介绍了如何通过经典的机器学习(Machine Learning, ML)方法来寻找那些流失可能性比较高的用户、寻找那些回流意愿比较大的用户。运营同学针对这些用户就可以重点干预,降低预流失用户比例,拉高用户的
腾讯技术工程官方号
2019-08-06
2.3K0
活动 | 腾讯×Nature Research:42问AI与机器人的未来
「 42. 」 这是科幻小说《银河系漫游指南》中智能计算机「Deep Thought(深思)」经过750万年运算,找到的「关于生命,宇宙及一切问题的终极答案」。 为什么是42?「深思」把这个问题交给了一台更高智能的电脑——地球来回答,目前仍无解。 受这个终极答案的启发,我们提出了「AI与机器人的42个大问题」,希望激发公众对人、AI与机器人未来的长远思考与规划。Yoshua Bengio和Jürgen Schmidhuber等顶尖科学家已选出他们最关心的问题,欢迎你也参与调研。 首届「 AI 与机器人
腾讯技术工程官方号
2019-08-05
7020
综述 | 生成对抗网络(GAN)在图网络中的应用
导语: 生成对抗网络(Generative Adversarial Network,简称GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。自2014年GAN网络提出以来,其在Computer Vision(计算机视觉)领域获得了广泛的关注,但GAN网络在其他领域的应用相对较少。将GAN网络的思想应用在图网络(network)特征表达是近一年新兴的课题,本文综述GAN模型在图网络表征学习方面的研究。 背景介绍 网络表征学习(Graph Representation Learni
腾讯技术工程官方号
2019-07-21
2.1K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档