首页
学习
活动
专区
工具
TVP
发布

达观数据

专栏作者
116
文章
152084
阅读量
39
订阅数
达观数据:5分钟带你理解机器学习及分类算法
机器学习是什么?机器学习是从历史数据(历史经验)中获取模型(规律),并将其应用到新的类似场景中。 举个很简单的例子:
达观数据
2019-11-07
7200
深度学习技术如何应用于文本智能处理?
在前不久InfoQ主办的Qcon全球软件开发大会上,达观数据创始人陈运文博士受邀出席发表了《文本智能处理的深度学习技术》的演讲。深度学习在人工智能领域已经成为热门的技术,特别是在图像和声音领域相比传统的算法大大提升了识别率。在文本智能处理中深度学习有怎样的具体实践方法?以下内容根据陈运文博士现场分享整理所得。 人工智能目前的三个主要细分领域为图像、语音和文本,达观数据所专注的是文本智能处理领域。文本智能处理,亦即自然语言处理,试图让机器来理解人类的语言,而语言是人类认知发展过程中产生的高层次抽象实体,不像图
达观数据
2018-06-04
1.2K0
达观数据2018Qcon分享深度学习前沿应用,文本智能处理前景无限
备受瞩目的2018Qcon"全球软件开发大会“近期在北京国家会议中心顺利举办。来自全球的架构师、工程总监、高级开发人员齐聚北京,共同探讨了未来软件开发方向。 作为 InfoQ 的重要合作伙伴,达观数据
达观数据
2018-06-04
6240
复旦大学肖仰华教授受聘达观数据,知识图谱技术将广泛应用于文本智能处理
News 新闻 3月29日,复旦大学计算机学院教授、知识工厂实验室创始人、国内最早从事知识图谱研究的学者之一肖仰华博士受聘担任达观数据高级顾问,进一步增强达观数据在文本智能处理领域的技术攻坚力量,共同
达观数据
2018-06-04
1K0
分享回顾丨如何利用NLP技术从海量文本中提取观点?
ABOUT CLASS 关于课程 本文为3月29日晚,达观数据联合创始人、文本审核组总负责人张健在将门技术社群,分享“文本观点挖掘技术及其应用”课题的内容回顾。主要内容包括结合实践经验,盘点观点挖掘的应用场景及价值、目前业界主流的观点挖掘技术以及该技术目前面临的挑战。 NO.1 什么是文本观点挖掘? 在简单介绍观点挖掘的基本概念之后,张健首先对“观点”的五个组成要素进行了强调: 观点评价对象(客体); 观点评价对象的属性。例如,我评价谁哪里哪里好,又哪里哪里不好,“哪里”就是属性; 观点所蕴含的情感极性。包
达观数据
2018-06-04
5K0
中国自然语言处理青年学者研讨会顺利举办,达观数据聚焦中文信息处理技术
YSSNLP 2018YSSNLP第十五届中国自然语言处理青年学者研讨会(以下简称YSSNLP)于2018年5月初在南京大学顺利举办。为促进自然语言处理领域国内外同行的交流,本次研讨会邀请了一些国内自
达观数据
2018-06-04
9310
零售业春天来了?四种方法带你提升线上销量
人工智能、机器学习和深度学习的发展改变了我们的生活。尽管有时人们还没有意识到,但实际上早已融入日常生活中:人工智能优化谷歌的搜索结果、亚马逊推荐的“猜你喜欢”,人工智能在零售和电商领域的影响不断扩大。 零售业如何结合人工智能提升行业收益?“猜你喜欢”之外人工智能技术还有哪些无限潜能? 1月23日,达观数据创始人陈运文博士受邀出席中国电商委举办的第六届中国电商年会,现场和电商行业领军者们分享了智能文本处理技术在电商行业的应用及未来。以下为演讲内容精华。 NO.1 电商行业数据分析难点 电商行业做数据应用时
达观数据
2018-04-02
8770
技术干货 | 一文详解LDA主题模型
作者简介 夏琦,达观数据NLP组实习生,就读于东南大学和 Monash University,自然语言处理方向二年级研究生,师从知识图谱专家漆桂林教授。曾获第五届“蓝桥杯”江苏省一等奖、国家二等奖。 本篇博文将详细讲解LDA主题模型,从最底层数学推导的角度来详细讲解,只想了解LDA的读者,可以只看第一小节简介即可。PLSA和LDA非常相似,PLSA也是主题模型方面非常重要的一个模型,本篇也会有的放矢的讲解此模型。如果读者阅读起来比较吃力,可以定义一个菲波那切数列,第 f(n) = f(n-1) + f
达观数据
2018-03-30
3.1K0
达观数据基于Deep Learning的中文分词尝试(下篇)
上周分享了本文上篇,现有分词、机器学习、深度学习库Keras技术知识,下篇将详细介绍达观数据使用深度学习的分词尝试。 基于深度学习方式的分词尝试 基于上面的知识,可以考虑使用深度学习的方法进行中文分词。分词的基础思想还是使用序列标注问题,将一个句子中的每个字标记成BEMS四种label。模型整的输入是字符序列,输出是一个标注序列,因此这是一个标准的sequence to sequence问题。因为一个句子中每个字的上下文对这个字的label类型影响很大,因此考虑使用RNN模型来解决。 环境介绍 测试硬件
达观数据
2018-03-30
1K0
分享 | 一文详解2017年深度学习NLP重大进展与趋势
作者通过本文概述了 2017 年深度学习技术在 NLP 领域带来的进步,以及未来的发展趋势,并与大家分享了这一年中作者最喜欢的研究。2017 年是 NLP 领域的重要一年,深度学习获得广泛应用,并且这
达观数据
2018-03-30
7980
技术干货 | 漫谈Word2vec之skip-gram模型
新媒体管家 作者简介 刘书龙,现任达观数据技术部工程师,兴趣方向主要为自然语言处理和数据挖掘。 word2vec是Google研究团队的成果之一,它作为一种主流的获取分布式词向量的工具,在自然语言处理
达观数据
2018-03-30
2.8K0
达观数据深度学习资料之卷积神经网络(下篇)
达观数据深度学习资料之卷积神经网络(下篇) 4.2什么是池化? 在通过卷积获得特征后进行分类,依然面临计算量大的挑战。及时一张96×96像素的图片,经过400个8×8的卷积核获取特征,每个特征映射图有(96-8+1)×(96-8+1)=7921维特征,总共有400×7921=3768400维特征向量,在此基础上进行分类是一个计算量很大的过程,由此引出了池化操作。 卷积神经网络的一个重要步骤是池化,对输入划分不重叠的矩形,对于每个矩形进行池化函数操作,例如取最大值、取最小值、加权平均等。池化的优势在于(1)
达观数据
2018-03-30
6490
技术分享 | 个性化推荐系统商业化的五大要素
在日前举行的2017 CSDI 中国软件研发管理行业峰会上,包括摩拜单车创始人及CTO夏一平、华为首席系统工程专家徐琦海、京东云、携程等一线互联网企业大数据平台负责人等在内一线技术大咖齐聚一堂,分享了各自领域的顶尖技术实践。在峰会大数据专场上,达观数据CTO纪达麒围绕“数据挖掘算法落地实践”做了主题演讲,就个性化推荐系统商业化的五大要素进行了详细探讨。下面为大家献上演讲的精华内容。 1 机器学习的原理并不神秘 最近“人工智能”特别火。“人工智能”的概念虽然很高大上,但从算法角度来说,离我们是很近的。这些
达观数据
2018-03-30
1.1K0
达观数据深度学习资料之卷积神经网络(上篇)
达观数据深度学习资料之卷积神经网络 (上篇) 1深度学习背景 深度学习是近十年来人工智能领域取得的最重要的突破之一,通过建立类似于人脑的分层模型结构对输入数据逐级提取从底层到高层的特征从而能很好
达观数据
2018-03-30
7800
达观数据干货|复旦肖仰华 当知识图谱“遇见”深度学习
肖仰华 复旦大学教授 复旦大学计算机科学技术学院,副教授,博士生导师,上海市互联网大数据工程技术中心副主任。主要研究方向为大数据管理与挖掘、知识库等。 大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的“喂养”下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽,深度学习模型效果的天花板日益迫近。另一方面大量知识图谱不断涌现,这些蕴含人类大量先验知识的宝库却尚未被深度学习有效利用
达观数据
2018-03-30
1.4K0
达观研讨会:深度学习在语义分析处理的最新发展|复旦邱锡鹏教授
近日,复旦大学计算机科学技术学院副教授邱锡鹏在达观数据主办的人工智能研讨会中发表主题演讲,就深度学习在语义分析处理中的应用做了深度剖析,细致地讲解了表示学习的研究趋势和现状,现将邱教授的演讲稿《深度学习在语义分析处理的最新发展》分享如下,供大家学习交流。 邱教授在分享中 表示学习相关知识介绍 深度学习的特点介绍 语言表示学习的介绍与研究 邱教授表示,最近分布式表示在很多自然语言处理任务表现出了巨大潜力,其将语言隐含的语法或语义
达观数据
2018-03-30
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档