首页
学习
活动
专区
工具
TVP
发布

达观数据

专栏作者
116
文章
152908
阅读量
39
订阅数
达观数据:如何利用社会化聆听挖掘有价值的商业情报(上篇)
现在,社交媒体数据挖掘领域有一个发展趋势,即客户需求逐渐由追求数据规模、浅层描述统计的舆情分析转向追求数据质量、深度挖掘信息价值的情报分析。
达观数据
2020-04-03
1.3K0
对话达观数据陈运文:文本智能处理潜力无限,“AI员工”将为企业处理90%的文本工作
消费互联网和企业互联网领域的认知隔阂由来已久,踏入所谓的DT时代后,黑科技滋生的速度仿佛跟不上人们对自动化、智能化美好生活的向往速度。在极客网看来,大数据、AI的应用才刚刚起步。在占据传媒头条的人脸识别、刷脸支付等锦上添花型应用的背后,大家似乎忽略了一个现实:占据人们大部分学习工作时间的文字文本,也还存在大量需要被AI化的地方。尤其是在企业级市场,倘若职员们能够从日常繁复的文字工作中解放出来,那将是一个多么令人兴奋的场景! 近日,达观数据的CEO陈运文接受了极客网的专访——一个曾经打卡于百度、盛大和腾讯,后
达观数据
2018-06-04
7440
达观数据参与华为AI及大数据共享日展示,智能文档审阅系统颇受好评
华为AI及大数据共享日 2018年4月27日-4月28日,华为举办了为期2天的AI及大数据共享日,意在加强AI大数据技术交流,进一步寻找厂商合作机会,共同支撑华为流程与IT的建设。业界诸多AI及大数据
达观数据
2018-06-04
6660
达观数据技术实践:知识图谱和Neo4j浅析
在当前大数据行业中, 随着算法的升级, 特别是机器学习的加入,“找规律”式的算法所带来的“红利”正在逐渐地消失,进而需要一种可以对数据进行更深一层挖掘的方式,这种新的方式就是知识图谱。 下面我们来聊一下知识图谱以及知识图谱在达观数据中的实践。 NO.1 知识图谱和 Neo4j 浅析 什么是知识图谱 知识图谱(Knowledge Graph)是一种用点来代替实体,用边代替实体之间关系的一种语义网络。通俗来说,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到
达观数据
2018-06-04
2.1K0
2018人工智能应用,将如何落地开花?
我相信2018年,人工智能将开始成为主流,并无处不在地影响我们的生活,为我们带来新的、有意义的改变。 —— 贺乐赋 微软全球资深副总裁 人工智能可以协助人类做很多工作,而且快速、高效、稳定。引入先进的人工智能技术,可以让企业从行业信息化市场进入到行业核心业务市场中。 —— 达观数据 创始人 陈运文 2018人工智能落地元年 大数据是人工智能发展的核心,通过把不同的数据聚合在一起,通过算法以及算力的支持,提炼出数据核心价值,是成就人工发展的必经路径。 我国
达观数据
2018-06-04
5390
新年将至,沉睡的文本数据也该醒醒了
随着企业收集的非结构化数据不断增加,文本智能处理的价值和流行趋势也处于上升阶段。越来越多的企业意识到利用文本挖掘从企业文本资源库中提取知识和提升效率的重要性。 达观数据联合创始人桂洪冠,近日作为邀请嘉宾在年末亿欧四周年庆典上和各领域嘉宾一同探讨了文本挖掘在企业中的应用现状及未来前景展望。桂洪冠作为文本智能领域的处理专家,在大数据架构与核心算法以及文本挖掘等领域有深厚的积累和丰富的实战经验。 和我们熟悉的结构化数据不同,当提到文本数据时,常有以下几种特点: 1.数据无结构化 文档格式多样化,通常以PDF、
达观数据
2018-04-02
1.1K0
技术干货 | 推荐系统中的冷启动问题和探索利用问题
冷启动和探索利用问题是推荐系统技术中的两个关键问题,本文结合达观数据的技术实战,对问题的解决方案进行了梳理和介绍。 1 前言 互联网技术和大数据技术的迅猛发展正在时刻改变我们的生活,视频网站、资讯app、电商网站等每天都有大量的活跃用户在不断的产生海量的用户行为,同时,每天又都产生大量的新增PGC或者UGC内容(如小说、资讯文章、短视频等)。 从推荐系统的角度来看,系统每时每刻都面临大量的新旧用户、新旧物品和大量的用户行为数据,对于用户,我们需要对要用户进行建模,去刻画用户的肖像和兴趣,然而我们常常面对
达观数据
2018-03-30
1.1K0
达观数据推荐系统实践—实时演算用户动态数据 提升运营效率
本文曾在infoq大数据微信群和数据猿直播平台上进行过分享,是对分享内容最直观的表达,同时对推荐系统架构和算法解释的也很详尽。 随着移动互联网技术的迅猛发展、互联网信息的爆炸式增长和种类的纷繁复杂,导致用户常常在面临信息选择时感到无所适从。这种选择多样性不但没有产生经济效益,反而降低了用户满意度。同时,互联网上的各种物品又存在长尾(long tail)现象,指大部分商品属于冷门而没有展示的机会。 Chris Anderson在2006年出版的《长尾理论》一书中指出,传统的80/20原则(80%的销售额来自于
达观数据
2018-03-30
2K0
达观数据:中国网民对媒体满意度整体下滑,上升的关键绝招竟是这些
对于中国网民来说,8 月最火事件,无疑是王宝强离婚和里约奥运会。而这两件事也成了媒体争先报道的宠儿。王宝强离婚事件众说纷纭,奥运会相关报道也随着新媒体的发展而逐渐走向泛娱乐。网络社交媒体和新媒体的报道不胜枚举,这些数据来源于中国网民,经过大数据的机器处理以更直观的方式回归于中国网民。这就是大数据的魅力所在。别说你不懂大数据,也许你看到的每一份报告都是大数据的产物。 中国网民和各类媒体交互出现问题? 王宝强离婚等热点报道给媒体赚取巨大流量的同时,也令中国亿万网民与千万媒体平台陷入了交互困难当中,到底是什么「
达观数据
2018-03-30
1.2K0
干货分享 |企业如何用文本挖掘技术提升运营效果?
新媒体管家 在刚刚过去的由神策数据举办的年度数据分析行业盛会—— 2017 数据驱动大会上,达观数据创始人兼CEO陈运文,作为自然语言处理领域的专家受邀出席了本次会议。并在人工智能分论坛上进行了题为《
达观数据
2018-03-30
1.1K0
大数据挖掘技术在企业创新中的应用(上篇)
1、引言 从人类文明诞生的那一刻起,数据就伴随我们而生——人类交流信息所用的文字和语言,计量距离或数量使用的记号和图案,观察自然所积累和传承的经验等,都是数据构成的。这些数据在百万年历史长河里,为人类文明的发展进化带来了难以估量的巨大价值。 自从人类发明了纸和笔,创造了数字、文字、几何技术后,数据有了更精确的描述和记录的方法,在此基础上催生出了数字、物理、化学,以及文学、艺术、管理等学科,我们今天所享受的现代文明,都深深的植根于数据技术。 随着互联网时代的大发展,数据记录逐步脱离了纸笔的限制,人类发明了廉价
达观数据
2018-03-30
9470
大数据挖掘技术在企业创新中的应用(下篇)
4、应用、方式和收益 4.1数据统计是大数据的最直接应用 数据统计是大数据应用的最直观的形式,数据统计在企业中常被称为商业智能(BI, Business Intelligence)系统,使用者们通过观
达观数据
2018-03-30
1.3K0
编译 | 人工智能与大数据开发的 12个注意点
选自《智能Web算法》(第二版) 达观数据编译 机器学习是人工智能研究领域的重要方向,在大数据时代里,对数据采集、挖掘、应用的技术越来越受到瞩目,并越来越创造出巨大的价值。 那么在人工智能和大数据的
达观数据
2018-03-30
5580
达观数据:发掘大数据时代下的媒体潜能
马云说:互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。近两年,“大数据”这个词不断涌入大众的耳海,面对大数据,许多人都一头雾水。它貌似有着高不可攀的地位,却早已无声无息的融入我们生活的方方面面。前段时间热门事件“小李子莱昂纳多结束22年的悲情陪跑,“冲奥”成功,登顶奥斯卡影帝”获得媒体的争相报道。但比这一事件更受大众关注的则是在颁奖典礼到来之前,国外媒体以及大数据分析平台就已经纷纷进行奥斯卡预测,某知名人工智能预测公司依靠大数据命中奥斯卡三项大奖,大数据的预测能力无疑成为这
达观数据
2018-03-30
7240
达观数据干货|复旦肖仰华 当知识图谱“遇见”深度学习
肖仰华 复旦大学教授 复旦大学计算机科学技术学院,副教授,博士生导师,上海市互联网大数据工程技术中心副主任。主要研究方向为大数据管理与挖掘、知识库等。 大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的“喂养”下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽,深度学习模型效果的天花板日益迫近。另一方面大量知识图谱不断涌现,这些蕴含人类大量先验知识的宝库却尚未被深度学习有效利用
达观数据
2018-03-30
1.4K0
达观数据分享文本大数据的机器学习自动分类方法
随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程(达观数据科技联合创始人张健)。文本分类有着广泛的应用场景,例如: ●新闻网站包含大量报道文章,基于文章内容,需要将这些文章按题材进行自动分类(例如自动划分成政治、经济、军事、体育、娱乐等) ●在电子商务网站,用户进行了交易行为后对商品进行评价分类,商家需要对用户的评价划分为正面评价和负面评价
达观数据
2018-03-30
1.2K0
达观数据CEO陈运文:如何运用大数据做好精细化营销
达观数据CEO陈运文被特邀为拓扑秀第五期(拓扑社旗下的线上活动)采访嘉宾,以下正文为线上分享实录,由拓扑社编辑后报道。 【陈运文简介】陈运文,博士,达观数据CEO;中国知名大数据技术专家,国际计算机学会(ACM)会员,中国计算机学会(CCF)高级会员,复旦大学计算机博士和杰出毕业生;在国际顶级学术期刊和会议上发表多篇SCI论文,多次参加ACM国际数据挖掘竞赛并获得冠军荣誉;曾担任盛大文学首席数据官(CDO),腾讯文学高级总监、数据中心负责人,百度核心技术研发工程师,在大数据挖掘、用户个性化建模、文本信息处理
达观数据
2018-03-30
9040
哈佛商学院教授大卫·约菲访问达观数据 共同探讨企业大数据未来
2017年3月28日,哈佛商学院教授大卫·约菲(David B.Yoffie)访问了达观数据。 教授的达观之行意在了解中国大数据发展趋势和达观的大数据产品,以期在未来寻求合作机会。 达观数据CEO陈运文亲自接待了教授一行,并向教授介绍了达观数据产品和大数据技术。 大卫·约菲(David B.Yoffie)教授毕业于哈佛和斯坦佛大学,从20世纪80年代开始在哈佛商学院(HBS)担任教授至今,80年代末加入英特尔董事会,至今仍然是英特尔和HTC的董事会成员。 在过去二十年中,约菲教授曾带领了哈佛商学院战略部
达观数据
2018-03-30
8900
达观数据应对大规模消息数据的处理经验
达观数据是为企业提供大数据处理、个性化推荐系统服务的知名公司,在应对海量数据处理时,积累了大量实战经验。其中达观数据在面对大量的数据交互和消息处理时,使用了称为DPIO的设计思路进行快速、稳定、可靠的消息数据传递机制,本文分享了达观数据在应对大规模消息数据处理时所开发的通讯中间件DPIO的设计思路和处理经验。 一、数据通讯进程模型 我们在设计达观数据的消息数据处理机制时,首先充分借鉴了ZeroMQ和ProxyIO的设计思想。ZeroMQ提供了一种底层的网络通讯框架,提供了基本的RoundRobin负载均衡
达观数据
2018-03-30
1.7K0
达观数据科技助力电商在大数据的海洋里破浪前行
曾经有一个笑话“隔着互联网,没有人知道对面是不是一条狗。”如今再看这个笑话却已是有几分老古董的味道,互联网不再是蒙住人们双眼的纱布,反而透过这个介质我们的生活习惯,兴趣偏好等等都会展露无遗。可以说,“隔着互联网,所有人都知道对面是条哈士奇。”这意味着随着信息技术的发展,数字化的虚拟世界逐步和现实世界进一步融合,虚拟世界的影响力会不断地渗透到现实,这样的未来有点像电影《黑客帝国》的场景,每个人都是由0,1这两个数字拟合的具象物,不论我们在网络上每一次购买,收藏,评论,还是在小说网站的搜索,放入书架都会在我们的
达观数据
2018-03-30
8200
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档