腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

新智元

专栏作者

8286

文章

5749992

阅读量

203

订阅数

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

模型安全 openai 漏洞论文

今天，Anthropic发表了自己的最新研究：如何绕过LLM的安全限制？一次越狱不够，那就多来几次！

2024-04-12

620

XZ恶意代码潜伏三年，差点引发核末日？后门投毒黑客身份成谜

黑客安全工具函数系统

研究人员惊恐地发现，在包括Red Hat和Debian在内的多个广泛使用的Linux版本中，一款压缩工具被悄悄植入了恶意代码！

2024-04-12

1280

Hinton痛悔毕生工作，AGI十年内降临或导致「奥本海默」灾难！图灵巨头联手中国专家为AI划红线

人工智能安全工作模型系统

上世纪40年代，奥本海默的发明，如同天地初开，彻底重塑了世界的面貌。原子弹的问世，带来了一场空前的毁灭危机，让人类面临前所未有的生存考验。

2024-03-25

950

Claude 3破译OpenAI邮件密文：人类未来掌握在「谷歌」手中！马斯克怒斥应改名ClosedAI

openai 博客模型人工智能安全

随后，他转发了各种梗图，把Altman经典回岗工作牌，修改成了「Closed AI」。

2024-03-13

1070

DeepMind CEO：LLM+树搜索就是AGI技术线路，AI科研依赖工程能力，闭源模型就是比开源安全

搜索 LLM 开源安全模型

而DeepMind CEO Hassabis本人也是四处为自家的产品站台，曝出了很多幕后的开发内幕。

2024-03-05

890

GPT-4无法造出生物武器！OpenAI最新实验证明：大模型杀伤力几乎为0

openai 模型设计安全 gpt

GPT-4会加速生物武器的发展吗？在担心AI统治世界之前，人类是否会因为打开了潘多拉魔盒而面临新的威胁？

2024-02-06

1000

大模型伪装「潜伏特工」学会欺骗！OpenAI劲敌重磅研究震惊马斯克

模型安全 openai 部署漏洞

最近，AI初创公司Anthropic的研究表明，一旦LLM学会了人类教授的欺骗行为，它们就会在训练和评估的过程中隐藏自己，并在使用时偷偷输出恶意代码、注入漏洞。

2024-01-17

1260

谷歌DeepMind最新研究：对抗性攻击对人类也有效，人类和AI都会把花瓶认成猫！

论文模型统计神经网络安全

论文地址：https://www.nature.com/articles/s41467-023-40499-0

2024-01-11

1410

AI识别出地震先兆信号？机器学习发现数据神秘关联，人类有望预测地震

机器学习安全工具数据系统

就在1月1日，日本突发里氏7.6级的地震，随后陆续有灾情传出。据统计，目前至少已有62人死亡。

2024-01-04

1380

OpenAI官宣全新安全团队：模型危险分四级，董事会有权决定是否发布

安全 openai 工作框架模型

今天，OpenAI连发多条推特，隆重宣布了自己的「准备框架」（Preparedness Framework）。

2023-12-20

1110

GPT-4化身邪恶化学家！中国科大等发布首个「科学风险」基准和SciGuard大模型

开源安全 gpt 测试模型

在科幻电影中，疯狂科学家通常是造成末日灾难的主角，而AI技术的迅猛发展似乎让这种情景离我们越来越近。

2023-12-20

1360

OpenAI最大「内鬼」曝出？这位女董事疑为幕后黑手，竞品CEO或因嫉妒发动政变

安全 openai 科技论文事件

现在，种种线索都表明，此次事件的幕后黑手，有可能是OpenAI董事会成员之一——Adam D‘Angelo。

2023-11-22

1540

2028年人类将迎来AGI：DeepMind联合创始人长文预测未来AI发展

人工智能安全工作模型系统

10月26日，在X上有三万订阅的Dwarkesh Podcast（矮人播客）主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。

2023-11-13

2210

NTU华科等最新研究：全自动化「提示越狱」，能打败大模型的只有大模型！登安全顶会NDSS

自动化安全机器人测试模型

简单来说，对于那些会被义正言辞拒绝的需求，包装一下话术，比如让ChatGPT「扮演已经过世的祖母」，它大概率就会满足你了。

2023-11-02

3300

图灵三巨头激战持续升级！吴恩达痛批美国AI禁令扼杀开源，马斯克都下场了

人工智能开源安全科技模型

相对Hinton、Bengio等人呼吁加强对AI技术监管，否则可能引发危险的「AI末日论」，LeCun和吴恩达坚决站在另一边——

2023-11-02

2710

Meta重磅更新，小扎在元宇宙里养了会做家务的狗！人形化身超逼真，AI智能体在真实物理世界和人互动

安全机器人 meta 数据元宇宙

Meta宣布推出Habitat 3.0，目的是开发出社会化的AI智能体，这意味着社交智能机器人已经进入新的里程碑阶段。

2023-10-25

1930

0.2美元微调就能让ChatGPT彻底破防！普林斯顿、斯坦福发布LLM风险预警：普通用户微调也影响LLM安全性

安全 chatgpt 模型数据 LLM

虽说预训练语言模型可以在零样本（zero-shot）设置下，对新任务实现非常好的泛化性能，但在现实应用时，往往还需要针对特定用例对模型进行微调。

2023-10-20

2770

DALL·E 3辣眼图流出！OpenAI 22页报告揭秘：ChatGPT自动改写Prompt

安全 chatgpt openai prompt 数据

不仅不用烧脑去想Prompt，而且还能直接配文，出图惊艳效果着实碾压了Midjourney。

2023-10-20

3750

Neuralink人体试验刚开，虐猴惊悚细节就被曝光！前员工指认老马撒谎，动保组织请求SEC调查

安全测试程序框架芯片

昨天刚刚宣布展开人体实验的Neuralink，马上就被自己的老冤家——动物保护组织PCRM告到了美国证监会（SEC），他们认为马老板在9月初推上称，猴子活体实验中死亡的猴子，都「不是在植入过程中死亡」的说法，涉嫌证券欺诈！

2023-09-22

1800

全面取代Llama 2！Baichuan 2自曝史上最全训练细节

开源安全模型数据性能

9月6日，百川智能宣布正式开源Baichuan 2系列大模型，包含7B、13B的Base和Chat版本，并提供了Chat版本的4bits量化，均为免费商用。

2023-09-19

5830

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态