首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8931
文章
6257441
阅读量
277
订阅数
长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale AI数据库正式开源
大模型(LLM)的浪潮已经涌动一年多了,尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场,成为当之无愧的风口。在 LLM 这条赛道上,有的研究专注于增加模型参数,有的疯狂卷多模态…… 这当中,LLM 处理上下文长度的能力成为了评估模型的一个重要指标,更强的上下文意味着模型拥有更强的检索性能。例如有些模型一口气可以处理高达 100 万 token 的能力让不少研究者开始思考,RAG (Retrieval-Augmented Generation,检索增强生成)方法还有存在的必要吗?
机器之心
2024-04-12
2220
对话蚂蚁韦韬:将用密态天空计算推动可信隐私计算应用的平等普惠
随着数字经济的不断深入,数据作为一种全新的生产要素成为影响市场的重要因素。在当下最火热的大模型创业潮之中,优质的数据是影响大模型训练效果关键之一,以往积累的稀缺行业数据甚至构成了部分公司的强有力壁垒。
机器之心
2023-08-07
2380
三维ImageNet开源!港中深韩晓光团队助力计算机视觉进入三维大数据时代
机器之心专栏 机器之心编辑部 随着深度学习技术的快速发展,数据驱动的方法已成为计算机视觉领域的核心。在过去的十年里,随着 ImageNet 诞生之后,计算机视觉领域见证了 “从数据中学习” 的范式的兴盛。在 ImageNet 上进行预训练,然后迁移到下游的视觉任务,都能显著提升模型性能,并且已经成为 2D 图像领域的标准化方式。 然而,由于真实世界 3D 数据(通常以点云或者 mesh 的形式)的扫描和标注非常繁琐,现有的 3D 数据集要么是合成的,要么与 ImageNet 的规模相去甚远。因此,与 2D
机器之心
2023-05-09
2530
面向现实世界场景,多语言大数据集PRESTO来了
机器之心报道 机器之心编辑部 PRESTO–一个多语言数据集,用于解析现实的面向任务的对话。 虚拟助理正日益融入我们的日常生活。它们可以帮助我们完成很多事情:从设置闹钟到在地图导航,甚至可以帮助残疾人更容易地管理他们的家。随着我们使用这些助手,我们也越来越习惯于使用自然语言来完成那些我们曾经用手完成的任务。 构建强大虚拟助理所面临的最大挑战之一是确定用户想要什么,以及完成这些任务需要哪些信息。在自然语言处理(NLP)的相关文献中,这件事被定义为一个面向特定任务的对话解析任务,其中给定的对话需要由系统解析,以
机器之心
2023-04-11
4790
十年磨砺,四代大数据平台演进,腾讯云为什么能够踩对历史的进程?
机器之心原创 作者:蛋酱 930 变革两年后,被寄予厚望的腾讯云在 To B 这张考卷上都写了什么? 从「深圳市腾讯计算机系统有限公司」注册成立,到成为服务用户最多的中国互联网企业之一,腾讯经历了互联网发展的黄金二十年。拥有众多国民级应用、十多亿 C 端用户的同时,这家公司对于自身技术的披露却一向低调。 当然,事情也正在发生变化:两年前,腾讯宣布正式「拥抱」产业互联网,并进行了第三次组织架构调整,史称「930 变革」。这家科技巨头积淀多年的技术能力,终于越来越多地从幕后走到台前,被寄予厚望的腾讯云,成为腾
机器之心
2023-03-29
9250
「腾讯大数据-天工」问世,鹅厂想用AI给大数据平台做自动驾驶系统
机器之心原创 作者:蛋酱 十年演进,腾讯大数据第四代数智融合计算平台「天工」终于问世,它有什么过人之处? 上世纪 80 年代,姚期智教授曾在一篇文章中提出了「百万富翁设想」:如果两个百万富翁在街头相遇,在出于隐私考虑不列举自己所有财产的前提下,他们如何比较出谁更富有? 这是一个密码学领域的经典问题,即一组互不信任的参与方在保护隐私信息以及没有可信第三方的前提下如何进行协同计算。随着信息技术的快速发展和个性化服务的演进,用户个人信息的跨境、跨系统、跨生态圈交互日益频繁,随之产生的隐私信息保护短板效应、隐私侵犯
机器之心
2023-03-29
5050
周五周末每天1小时,未成年人网游「防沉迷」靠刷脸、大数据验证身份?
机器之心报道 机器之心编辑部 周末不能补课,平时也不能玩游戏。 8 月 30 日,国家新闻出版署发布了《关于进一步严格管理切实防止未成年人沉迷网络游戏的通知》,限制 18 岁以下未成年人每天玩网络游戏时间为一小时,且仅在周五、周六和周日,以及公共假期时间晚 8-9 点上线。 这些限制适用于包括手机在内的任何设备,「网络游戏」的定义,指所有在网络上提供服务的游戏,包括玩家语境中狭义的网游,也包括 PC 单机和主机游戏,覆盖国内过审上线的 WeGame 平台上的 PC 单机游戏、国行主机发行的主机游戏,但暂时
机器之心
2023-03-29
8760
37页pdf,埃默里大学最新「大数据时代事件预测」综述,ACM顶级期刊上发表
机器之心专栏 作者:赵亮 事件是基于特定地点、时间和语义发生的对我们的社会或自然环境产生重大影响的事情,例如地震、内乱、系统故障、流行病和犯罪。能够提前预测此类事件的发生以减少潜在的损害是非常重要的。虽然事件预测传统上极具挑战性,但它现在正成为大数据时代的一种可行选择并正在经历快速增长。当然,这也归功于高性能计算机和人工智能技术的进步。最近来自艾默里大学的教授赵亮博士首次对该领域进行了全面的综述和数据代码资源整理。该工作全面总结了事件预测的问题定义,方法,应用,测评,数据,以及未来发展方向。该工作刚刚发表
机器之心
2023-03-29
3280
智慧城市物联网国家重点实验室(澳门大学)诚聘博士后研究员
本期将为大家介绍智慧城市物联网国家重点实验室(澳门大学)招聘博士后研究员相关信息。 智慧城市物联网国家重点实验室(澳门大学)于 2018 年 7 月获国家科技部批准成立。作为全国第一个智慧城市物联网领域的国家重点实验室,秉持 “国家所需,澳门所长” 的精准定位,根据 “世界一流,澳门特色” 的要求,实验室定位解决智慧城市物联网关键科学和技术问题,提出带有基础性和共性的理论、算法和系统,开发智能城市的示范应用。有关实验室的更多信息可浏览︰https://skliotsc.um.edu.mo/。 智慧城市物联
机器之心
2023-03-29
3970
香港理工大学招收大数据/机器学习博士生/博士后
本期将为大家介绍香港理工大学Jieming Shi 团队招收博士生、博士后等若干岗位信息。 学校院系简介 香港理工大学位于中国香港特别行政区,QS 排名世界 65,THE 排名 79。计算机系(Department of Computing)QS 学科排名 51-100。 导师信息 Jieming Shi 博士,助理教授。主要研究领域为大数据、数据挖掘、机器学习;主要科研成果发表于 SIGMOD,VLDB,NeurIPS,WWW,TKDE,ICML 等,获得 VLDB 2021 Best Paper Aw
机器之心
2023-03-29
3990
从BERT到ChatGPT,百页综述梳理预训练大模型演变史
机器之心报道 编辑:张倩 这篇近百页的综述梳理了预训练基础模型的演变史,让我们看到 ChatGPT 是怎么一步一步走向成功的。 所有的成功都有迹可循,ChatGPT 也不例外。 前不久,因为对 ChatGPT 的评价过于苛刻,图灵奖得主 Yann LeCun 被送上了热搜。 在他看来,「就底层技术而言,ChatGPT 并没有什么特别的创新,」也不是「什么革命性的东西」。许多研究实验室正在使用同样的技术,开展同样的工作。更重要的是,ChatGPT 及其背后的 GPT-3 在很多方面都是由多方多年来开发的多种技
机器之心
2023-02-28
1.2K0
被ChatGPT带飞的AIGC,能为垂直产业做些什么?
机器之心发布 机器之心编辑部 本文从 AIGC 技术 -> 产品 -> 业务应用和价值实现环节探讨其发展路径,并以产业实例探讨 AIGC 如何才能在产业领域实现闭环和价值落地。 去年以来出现了 AIGC 热潮,引发了 AIGC 及其应用话题的爆发性增长,不少人感慨强人工智能的时代已经离我们不那么遥远了。但是在热潮的另一面,我们看到真正能落地的场景依然是凤毛麟角,目前比较成功的应用主要集中在个人消费领域,而 AIGC 在产业中的应用大多仍然处于探索阶段。 红杉资本在 22 年 9 月就对 AIGC 做出了以
机器之心
2023-02-23
5920
工程与产品的胜利,深度剖析ChatGPT和聪明地设计基础架构
机器之心转载 来源:Suits and Hoodies 这里转载一篇深度剖析ChatGPT成功的一篇好文章:ChatGPT 实际上并不是普通人眼中的「黑科技」,而是持续开放科研的产物,是工程与产品的胜利。它将促使Infrastructure成为最大的赢家。 在这个 AI 时代,语言模型已经成为了人机交流的关键工具。而 ChatGPT 则是其中的佼佼者,这个由 OpenAI 训练的模型,以其卓越的理解和生成能力,成为了一个人人景仰的网红:所以第一篇写 ChatGPT ,抛砖引玉,仅代表个人意见,不代表现在或之
机器之心
2023-02-23
3860
在re:Invent 2022大会上,我们看到了云计算的未来
AI 圈里很多人都听说过开源 AI 作画扩散模型 Stable Diffusion,见识过 AI 图片横扫朋友圈。最近大模型兴起除了造梗图之外,应用前景也在逐渐清晰,AIGC(人工智能生成内容)成为了众多科技公司正在尝试的领域。
机器之心
2022-12-16
5190
机器之心要为你介绍工作了
「TalentAI」将不定期带来人工智能技术类职位的招聘信息,欢迎正在找工作与看新机会的朋友关注,也欢迎企业伙伴与我们联系合作。 本期「TalentAI」共有 4 家企业的 8 个在招职位,详情如下: 微软中国-DeepSpeed researcher / senior researcher 上海天演私募基金管理有限公司 量化研究员 北京衔远有限公司 NLP算法工程师 大数据开发工程师 九坤投资(北京)有限公司 量化策略研究员 数据科学家 AI算法研究员 量化实现工程师(AI infra 方向) 简历投递
机器之心
2022-09-26
5380
从AI为宠物投保这个「小事」讲起,保险变革开始了
机器之心发布 机器之心编辑部 2021 年《旧金山纪事报》报道过一个故事,人工智能 GPT-3 竟然让一个人和他死去的未婚妻进行了对话。 故事的男主角叫 Joshua,女主角叫 Jessica,Jessica 因病早逝,Joshua 伤心欲绝,一次偶然的机会,他把自己和 Jessica 的所有聊天记录都「投喂」给了人工智能 GPT-3,此后,约书亚有空就和 GPT-3 聊天,神奇的事情发生了。Joshua 真的感觉到电脑屏幕对面就是 Jessica 本人。事情最后的结局是,Joshua 终于走出了未婚妻早逝
机器之心
2022-09-06
2310
为什么当下隐私计算可用性不及预期?
机器之心报道 机器之心编辑部 9 月 2 日,“WAIC2022· 金融科技与数据要素论坛”如期举行,论坛由世界人工智能大会组委会办公室指导,华东师范大学长三角金融科技研究院、上海市人工智能行业协会、机器之心主办。上海市经信委人工智能发展处副处长孙跃出席会议并致辞。在论坛的圆桌讨论环节,嘉宾们普遍表示,目前隐私计算的整个发展形势非常蓬勃向上,但对于可用性来说,稍微有些不及预期。我们需要提高可用性,在解决这一挑战过程中,有几个特别值得我们关注和倾注全力的问题。 继去年在世界人工智能大会上大放异彩后,隐私计算再
机器之心
2022-09-06
2860
我们需要什么样的产业AI?
机器之心原创 作者:吴昕 正因为京东以供应链角度去管理业务,才会结出京东云这样的果。和其他的云不同,京东的产业 AI 能力是围绕着 “十节甘蔗” 形成长的数据链,在数智供应链场景中长出来的能力。 京东的差异化能力积累就是供应链能力。自己就是这么成长起来的,产业禀赋在,那就发挥长处,而企业正好也需要这个,此时出手,正是时候。 京东云也不是野蛮生长,而是找到了内生逻辑——与竞对不是零一的博弈,而是创造增量和需求,匹配需求,获得高速增长。 “你好,你的快递到了。”接到京东快递的电话时,我正站在武汉某
机器之心
2022-09-06
3420
院士领衔、20+ 重磅嘉宾共聚一堂,「WAIC 2022 · 可信隐私计算高峰论坛」全日程首次揭秘
2022 世界人工智能大会将于 9 月 1 - 3 日在上海世博中心举办,并在浦东与徐汇设立分会场。 作为 2022 世界人工智能大会的重要分论坛之一,由世界人工智能大会组委会办公室指导,中国信通院云计算与大数据研究所、蚂蚁集团、机器之心主办,联合隐私计算联盟、隐语开源社区共同举办的「WAIC 2022 · 可信隐私计算高峰论坛」将在 9 月 3 日上海市世博会议中心隆重举办。 本场论坛全天展开,旨在打造每年一度的隐私计算领域高规格交流平台。论坛设置主旨演讲、精彩发布、成果发布、主题分享、圆桌对话和论文分享
机器之心
2022-08-29
4160
WAIC金融科技与数据要素论坛报名启动,共论隐私计算助力金融数据治理
在这里,看懂隐私计算与金融数据的融合应用 2022 世界人工智能大会(WAIC)将于 9 月 1 日至 3 日,以线下线上结合的方式召开。本次大会将立足上海世博中心,联动浦东、徐汇等区。 数字经济时代,数据要素是基础性资源。在对数据价值的挖掘与使用上,高数据需求的金融业走得尤为靠前。9 月 2 日下午,由世界人工智能大会组委会办公室指导,华东师范大学长三角金融科技研究院、机器之心主办的「WAIC 2022 · 金融科技与数据要素论坛」将在张江科学会堂 304 举办。 本次论坛聚焦金融业数据要素融合生态建设
机器之心
2022-08-25
1.1K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档