前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多家AI公司获融资;字节秘密启动AI手机研发,锤子手机和PICO VR团队领衔;国内首个Sora级视频生成模型诞生丨AI情报局

多家AI公司获融资;字节秘密启动AI手机研发,锤子手机和PICO VR团队领衔;国内首个Sora级视频生成模型诞生丨AI情报局

作者头像
AI科技评论
发布2024-06-17 16:02:24
900
发布2024-06-17 16:02:24
举报
文章被收录于专栏:AI科技评论AI科技评论
01

融资快报

Anterior获2000万美元A轮融资:Anterior是一家医疗AI服务商,利用生成人工智能简化事先授权流程。本次融资由NEA牵头,红杉资本、蓝狮环球和Neo的支持。

Realtime获B轮融资:Realtime是一家机器人自动化解决方案提供商,使单个或多个机器人能够在非结构化和无笼的环境中全速自主运行。本次融资由三菱电机领投。

江行智能完成B轮融资:江行智能致力于深度融合边缘计算与人工智能技术,专注新一代云边协同的智能物联网产品与服务。本次融资由朗玛峰创投、卓源亚洲、松禾资本、联想创投、百度风投等多家国内AI投资公司联合战略投资。

磅策医疗完成数千万元Pre-B轮融资:磅策是一家医疗穿刺机器人研发商,本轮融资由合肥创新投领投,永捷基金和越富基金跟投。

FirmPilot完成500万美元A轮融资:AI律所营销初创公司FirmPilot宣布筹集了500万美元的A轮融资。本轮融资由Blumberg Capital领投,Valor Ventures、SaaS Ventures、FJ Labs和Connexa Capital等新老投资者也参与了本轮融资。

Alexi完成1100万美元A轮融资:Alexi是加拿大AI法律科技初创公司,本轮融资由Drive Capital领投,现有投资者包括Draper Associates也参与了投资。

iGenius寻求以17亿欧元的估值融资6.5亿欧元:意大利AI初创公司iGenius推出“Italia”一个开源的基础大型语言模型,旨在供金融服务行业等组织的使用。其首席执行官表示,他们正在寻求筹集6.5亿欧元的新资金,以实现约17亿欧元的融资后估值。

CampusAI完成1000万美元种子资金:CampusAI旨在建立一个虚拟在线校园,为企业和个人提供AI培训与实践的新型平台。这笔融资来自波兰天使投资人Maciej Zientara。

Mistral AI完成B轮6.44亿美元融资,估值达到60亿美元:法国人工智能初创公司 Mistral AI从众多金融和科技投资者那里筹集了6亿欧元(6.44亿美元)。风险投资公司General Catalyst领投了此轮融资,其他投资者包括Andreessen Horowitz和 Lightspeed Venture Partners等。Nvidia Corp.、三星风险投资公司、思科系统公司和国际商业机器公司等企业投资者也参与了此轮融资。

(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)

02

业界动态

国内情报

徐凌杰创立魔形智能,国际头部 GPU 高管加盟:

前「壁仞科技」总裁徐凌杰,离开壁仞4个月后,于2024年6月份,正式成立了上海魔形智能有限公司。据悉魔形智能致力于提供面向大模型的软硬件一体优化平台,从而降低大模型的使用成本。此前有行业人士称,徐凌杰未来可能会独立创业,围绕“算力+大模型”赛道。

AI科技评论注意到,徐凌杰新公司注册资本高达1000万美金,据可靠消息,新公司中,还有一位国际头部GPU厂家的中国区高管强势加盟。

360发布会被指盗图,回应遭创作者10倍索赔:

AIGC创作者DynamicWang发文称,360AI新品发布会盗用他通过AI绘图模型生成的图片,并在发布会上进行产品“局部重绘”功能演示,事情发酵后360AI浏览器产品经理梁志辉正式进行了回应。回应的核心点有3个:1、360是在该创作者的原图上生成的图片,难道这位创作者训练模型使用的图片都有版权?2、虽然版权问题很模糊,但360第一时间联系这位创作者进行了道歉。3、360方面试图沟通协商解决问题。不过对方提出希望360以10倍价格购买模型,并另行支付赔偿费用。360表示不认同,决定通过诉讼来判断版权问题。

随后,DynamicWang在社交平台晒出梁志辉和360多人的聊天记录并称360梁志辉是在贼喊捉贼,自己则首要的是赔偿和道歉,购买模型授权合作是后话。(九派财经、三言科技)

极佳科技联合清华大学,发布端侧可用Sora级视频生成大模型:

极佳科技联合清华大学发布了中国首个 Sora 级的视频生成模型“视界一粟”。该模型拥有原生的 16 秒超长时长,并可生成至1分钟以上,以及超大运动、超强表现力和懂物理世界等特点,同时成本低、速度快且端侧可用。它基于团队自研的视频生成技术,融合了 LLM 和扩散模型的自研架构,在多模态融合、训练效率、推理效率和模型效果等方面达到了极致的优化。

字节秘密启动AI手机研发,锤子手机和PICO VR团队领衔:

据报道,字节跳动已于两个月前秘密启动AI手机研发项目。该项目核心团队主要由原锤子手机研发团队和PICO VR研发团队组成。而字节在AI+硬件的布局,则涵盖了手机、眼镜和耳机等所有主流赛道。

粉笔将于8月推出自研AI智能老师:

AI智能老师将成为粉笔线上平台提供的AI学习工具之一,率先应用于其国家或省级招录类及资格证考试系统班,成为其重要组成部分。

哈工大新成果,中国首台全天候激光智能除草机器人落地:

哈工大机器人实验室与华工科技合作研发了中国第一台全天候智能激光除草机器人,目前已在黑龙江黑河市爱辉区开展田间试验。该机器人集成深度学习的人工智能技术,能够识别杂草和定位目标分生组织,实现“环境零污染、土地零破坏、昼夜作业”。哈工大机器人实验室是我国最早开展机器人技术研究的单位之一,也是全国唯一的机器人技术全国重点实验室。

支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate:

华中科技大学、阿里巴巴、中国科学技术大学的研究团队提出了UniAnimate 框架,以实现高效且长时间的人类视频生成。通过 UniAnimate 框架,用户可以生成高质量的时序连续人类跳舞视频。通过多次使用 First Frame Conditioning 策略,可以生成持续一分钟的高清视频。

全面超越Transformer!清华蚂蚁推出纯MLP架构:

TimeMixer模型采用了一个多尺度混合架构,旨在解决时间序列预测中的复杂时间变化问题。为了验证TimeMixer的性能,团队在包含长程预测,短程预测,多元时序预测以及具有时空图结构的18组基准数据集上进行了实验,包括电力负荷预测、气象数据预测和股票价格预测等。结果表明,TimeMixer在多个指标上全面超越了当前最先进的Transformer模型。

复旦大学将在下一个学年推出至少100门AI领域课程:

从今年秋季学期开始,复旦大学将在2024-2025学年推出至少100门AI领域课程。AI大课将以AI-BEST课程体系的形式,进入所有复旦学生的学业安排,分别为:本研一体化打造AI通识基础课程、AI专业核心课程、AI学科进阶课程和AI垂域应用课程。

郭明錤称苹果Apple Intelligence对投资人只是锦上添花:

天风国际证券分析师郭明錤发布简评称,苹果新发布的Apple Intelligence套件展现了Apple的生态整合与界面设计优势,对使用者很实用,但对投资人只是锦上添花。投资人期待看到原创且非用不可的功能,此外投资人的顾虑还包括Apple Intelligence没法全球同时上市、整合ChatGPT之关键卖点能否在中国市场使用。

国际情报

不只 ChatGPT,苹果希望将谷歌 Gemini 等其他 AI 模型也添加到 iOS 18:

苹果软件工程高级副总裁 Craig Fedrighi 在 WWDC24 开发者大会透露:“我们期待在未来与其它 AI 模型集成,例如谷歌的 Gemini。”他还提到,苹果希望最终让用户在不同的 AI 大模型之间进行选择,从而与 Apple Intelligence 一起使用。此前多方消息透露,苹果与谷歌谈判为 iPhone 内置 Gemini AI。

马斯克威胁称若在操作系统整合OpenAI,我的公司将不许使用苹果:

马斯克表示,由于OpenAI不尊重用户的数据隐私,若苹果在操作系统级别整合入ChatGPT的功能,他旗下的所有公司将禁止使用苹果设备,访客需要把设备存放到法拉第笼(防止电磁场进入或逃脱的金属外壳)中。仅他旗下最大的公司特斯拉在全球雇员便超过14万。

OpenAI 正式宣布聘请新的 CFO 与 CPO:

OpenAI 正式宣布聘请了 Sarah Friar 和 Kevin Weil 分别担任 CFO 以及 CPO 职务。Friar 将负责 ChatGPT 业务以及通过微软向微软云客户出售 OpenAI 技术的收入。目前 OpenAI 由Peter Deng 负责 ChatGPT 和 ChatGPT Enterprise 产品开发,而 Peter Welinder 或成另一位产品负责人。

OpenAI 升级 ChatGPT 语音,使其能够以不同角色的声音说话:

OpenAI正在更新 ChatGPT 的语音功能,允许用户使用各种 AI 生成的声音和声音风格与聊天机器人进行交互。新功能让 ChatGPT 用户可以指示 AI 聊天机器人使用任何语音实时做出响应。OpenAI 表示,新的语音功能将在“未来几周内”推出。

Anthropic公开Claude 3,像人类一样特殊性格训练方法:

Anthropic认为,输出内容的安全、合法性对于大模型的场景化落地至关重要,但是一味的打压它们进行超级安全对齐,输出的内容也会千篇一律毫无新意,会使大模型失去个性化,无法突出“智能”的效果。

所以,Anthropic在训练Claude3时,使用了一种特殊的个性化训练方法(Constitutional AI: Harmlessness from AI Feedback),在保持安全的前提下,还能输出一些有趣、更具创新性的内容,也是该模型实现超强性能的关键之一。

谷歌推出AGREE框架增强大型语言模型生成内容准确性:

该框架通过检索相关段落来提高回答准确性,并为用户提供验证信息真实性的途径。核心技术包括训练阶段微调和测试时自适应。实验结果显示AGREE在提升内容回答准确性和引用性方面表现突出。

Meta面临隐私问题,试图利用欧洲数据训练人工智能模型:

Meta 称其需要使用欧洲用户的公开数据来训练人工智能模型,以更好地反映欧洲用户的语言、地理和文化情况,并已向用户发送通知和电子邮件,解释其计划并提供选择退出的链接。最新版本的隐私政策将于 6 月 26 日生效。

据悉英特尔将停建耗资250亿美元的以色列工厂:

以色列财经新闻称,英特尔将停止在以色列投资 250 亿美元建厂的计划,之后英特尔在声明中表示需要让大型项目适应不断变化的时间表,但并未直指该项目,并强调以色列仍是其重要的全球生产和研发基地之一。以色列政府去年 12 月同意向英特尔拨款 32 亿美元用于在以色列南部建造芯片工厂。

未来近50% 的人希望有AI克隆能帮他们做这些事:

全球近一半消费者希望在2035年之前拥有AI克隆,来代劳个人事务,包括购物。到2035年,三分之三的全球消费者希望他们的家电和车辆能够自主重新订购零部件和安排维护预约。亚太地区的消费者对让AI处理个人生活方面更为舒适,88% 愿意将工作和个人日程安排任务交给AI助手。

更多国际情报

未经同意,人工智能利用儿童整个童年时期的照片进行训练:据国际人权组织人权观察报告披露,一些流行的AI图像生成器所使用的训练数据集(LAION-5B),存在大量未经允许使用的巴西儿童个人照片,引发儿童隐私和安全的严峻挑战。

英特尔团队提出L-MAGIC新技术:在CVPR2024上,蔡志鹏博士及其团队提出L-MAGIC。这项技术通过结合语言模型和图像扩散模型,实现了高质量、多模态、零样本泛化的360度场景生成。

谷歌Deepmind表示开放式AI是实现超级智能的关键:他们认为,单纯依靠不断扩大的数据集并不足以实现超级人工智能,而现有的规模化策略往往集中在使用更多的计算资源和数据。AI 系统必须能够以开放式的方式产生新知识,并自主改进其学习能力。

「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷:LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。

哲学家称AI不是幻觉而是胡说八道:他们指出AI并非经历幻觉,而是在复制训练数据中的人类语言模式,并不关心事实的准确性。因此建议用"AI胡说八道"来更准确地描述这一现象。

03

AI明星产品

Product Hunt 热榜,高效总结与保存在线内容Recall

Recall 是一个帮助用户总结并保存在线内容的工具,它能自动总结用户遇到的各种内容,并将其保存到知识库中。该知识库不仅自动组织和分类内容,还通过知识图谱技术帮助用户发现信息之间的联系,从而更深入地理解复杂主题。此外,Recall 还提供了间隔重复学习功能,帮助用户更好地学习和记忆。

🔗https://www.getrecall.ai/

GitHub Trending 热榜,专为网页开发设计的机器学习库Transformers.js

Transformers.js 是一个专为网页开发设计的机器学习库,开发者能在浏览器中直接运行 Hugging Face 的 Transformers 模型。这个库支持多种自然语言处理任务,如文本分类、问答和翻译,以及计算机视觉任务如图像分类和目标检测,还有音频任务如自动语音识别。通过使用 ONNX Runtime 和 Hugging Face 的 Optimum 工具,Transformers.js 能将 PyTorch、TensorFlow 或 JAX 模型转换为浏览器可运行的 ONNX 格式。

Transformers.js 提供了详细的文档,包括快速入门、教程、开发者指南和 API 参考,帮助开发者快速上手和深入理解。此外,网页上还有丰富的示例应用程序和模板,如基于 Whisper 的语音识别和实时图像识别游戏,供开发者参考和使用。若某些任务或模型暂不支持,用户还可以在 GitHub 上提出功能请求,让 Transformers.js 更加完善。

🔗https://github.com/xenova/transformers.js

开发者推荐

1.“Abliteration” 技术:解锁大型语言模型的无限可能

一种名为 “abliteration” 的技术正在引起关注,它能够在不重新训练大型语言模型的情况下,取消其审查功能,使模型能够回应所有类型的提示。

详细讲解了 abliteration 技术的实现过程。第三代 Llama 模型虽然在执行指令方面表现优秀,但配备了强大的审查机制以防止滥用。abliteration 技术通过识别并移除模型中的 “拒绝方向”,在推理时间或通过权重正交化永久取消模型的拒绝行为。文章还提供了具体的代码实现步骤,包括数据集准备、模型激活收集、拒绝方向的识别和选择,以及如何通过权重正交化实现 abliteration。此外,作者通过对 abliterated 模型进行 DPO 微调,修复了取消审查后可能导致的性能下降,并展示了模型在不同基准测试中的表现。

🔗https://huggingface.co/blog/mlabonne/abliteration

2.MASA:全新零样本跟踪利器

MASA是一种由 ETH Zurich 的 Siyuan Li 等人提出的创新实例外观模型。MASA 能够在任何视频领域内匹配各种物体,无需依赖标注的视频数据集。通过与 Segment Anything Model的结合,MASA 展现了强大的零样本跟踪能力。

利用 SAM 提供的丰富物体分割输出,通过穷尽的数据变换学习实例级别的对应关系。它将 SAM 的输出视为密集的物体区域提议,并在大量图像集合中匹配这些区域。此外,MASA 设计了一个通用适配器,可以与基础的分割或检测模型配合使用,增强它们的追踪能力。在多个挑战性的多目标跟踪(MOT)和分割(MOTS)基准测试中,MASA 使用未标注的静态图像,在零样本关联任务中取得了卓越的成绩。

🔗https://matchinganything.github.io/

3.MaPa:文本驱动的 3D 网格材质生成方法

浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa。MaPa可以将文本描述转化为高质量、可编辑的 3D 网格材质图。通过使用预训练的 2D 扩散模型和分段控制的扩散模型,MaPa 在不需要大量配对数据的情况下,实现了与 3D 网格部件对齐的 2D 图像生成,并通过可微渲染模块微调材质图参数,确保生成的材质符合文本描述。

实验结果表明,MaPa 在光照现实感、分辨率和可编辑性方面表现优异,超越了现有方法。其详细的管道流程包括分段、分组、选择和迭代渲染与优化,确保材质纹理的细致和真实。

🔗https://zhanghe3z.github.io/MaPa/

04

大牛洞见

重磅发布!顶级 ML/LLM 专家联名撰写的《过去一年中构建 LLMs 中学到了什么?》三部曲

这套三部曲分享了过去一年中在构建 LLM 应用时的宝贵经验和教训,涵盖了从战术到战略的各个方面。

战术篇

提示工程:如何设计有效的提示?使用小型、专注的提示代替复杂的提示。

信息检索:提升知识基础和输出质量的最佳实践。

工作流程:设计可靠的工作流程,确保流程的可管理性。

微调与评测:提示工程不足时,如何进行微调和评测?

运营篇

团队建设:如何构建多元化且高效的 LLMs 团队?

持续部署:确保产品质量和用户体验的可靠和可持续部署建议。

战略篇

产品市场适应度:先找到 PMF,构建系统而非模型。

成本控制与迭代:如何在保持竞争力的同时控制成本与迭代产品?

LLMs 的实际应用

强调 LLMs 已经足够成熟,可以在实际应用中使用。

构建有效的 LLM 应用比展示演示更加困难,需要从战术、运营和战略三个层面全面考虑。

🔗https://applied-llms.org/

敬请期待明日的最新动态

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.“Abliteration” 技术:解锁大型语言模型的无限可能
  • 2.MASA:全新零样本跟踪利器
  • 3.MaPa:文本驱动的 3D 网格材质生成方法
  • 重磅发布!顶级 ML/LLM 专家联名撰写的《过去一年中构建 LLMs 中学到了什么?》三部曲
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档