首页
学习
活动
专区
工具
TVP
发布

新智元

专栏作者
8286
文章
5749992
阅读量
203
订阅数
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!
今天,Anthropic发表了自己的最新研究:如何绕过LLM的安全限制?一次越狱不够,那就多来几次!
新智元
2024-04-12
620
XZ恶意代码潜伏三年,差点引发核末日?后门投毒黑客身份成谜
研究人员惊恐地发现,在包括Red Hat和Debian在内的多个广泛使用的Linux版本中,一款压缩工具被悄悄植入了恶意代码!
新智元
2024-04-12
1280
Hinton痛悔毕生工作,AGI十年内降临或导致「奥本海默」灾难!图灵巨头联手中国专家为AI划红线
上世纪40年代,奥本海默的发明,如同天地初开,彻底重塑了世界的面貌。原子弹的问世,带来了一场空前的毁灭危机,让人类面临前所未有的生存考验。
新智元
2024-03-25
950
Claude 3破译OpenAI邮件密文:人类未来掌握在「谷歌」手中!马斯克怒斥应改名ClosedAI
随后,他转发了各种梗图,把Altman经典回岗工作牌,修改成了「Closed AI」。
新智元
2024-03-13
1070
DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力,闭源模型就是比开源安全
而DeepMind CEO Hassabis本人也是四处为自家的产品站台,曝出了很多幕后的开发内幕。
新智元
2024-03-05
890
GPT-4无法造出生物武器!OpenAI最新实验证明:大模型杀伤力几乎为0
GPT-4会加速生物武器的发展吗?在担心AI统治世界之前,人类是否会因为打开了潘多拉魔盒而面临新的威胁?
新智元
2024-02-06
1000
大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克
最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。
新智元
2024-01-17
1260
谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!
论文地址:https://www.nature.com/articles/s41467-023-40499-0
新智元
2024-01-11
1410
AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震
就在1月1日,日本突发里氏7.6级的地震,随后陆续有灾情传出。据统计,目前至少已有62人死亡。
新智元
2024-01-04
1380
OpenAI官宣全新安全团队:模型危险分四级,董事会有权决定是否发布
今天,OpenAI连发多条推特,隆重宣布了自己的「准备框架」(Preparedness Framework)。
新智元
2023-12-20
1110
GPT-4化身邪恶化学家!中国科大等发布首个「科学风险」基准和SciGuard大模型
在科幻电影中,疯狂科学家通常是造成末日灾难的主角,而AI技术的迅猛发展似乎让这种情景离我们越来越近。
新智元
2023-12-20
1360
OpenAI最大「内鬼」曝出?这位女董事疑为幕后黑手,竞品CEO或因嫉妒发动政变
现在,种种线索都表明,此次事件的幕后黑手,有可能是OpenAI董事会成员之一——Adam D‘Angelo。
新智元
2023-11-22
1540
2028年人类将迎来AGI:DeepMind联合创始人长文预测未来AI发展
10月26日,在X上有三万订阅的Dwarkesh Podcast(矮人播客)主持人Dwarkesh Patel采访了谷歌DeepMind的创始人兼首席AGI科学家Shane Legg。
新智元
2023-11-13
2210
NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS
简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。
新智元
2023-11-02
3300
图灵三巨头激战持续升级!吴恩达痛批美国AI禁令扼杀开源,马斯克都下场了
相对Hinton、Bengio等人呼吁加强对AI技术监管,否则可能引发危险的「AI末日论」,LeCun和吴恩达坚决站在另一边——
新智元
2023-11-02
2710
Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动
Meta宣布推出Habitat 3.0,目的是开发出社会化的AI智能体,这意味着社交智能机器人已经进入新的里程碑阶段。
新智元
2023-10-25
1930
0.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性
虽说预训练语言模型可以在零样本(zero-shot)设置下,对新任务实现非常好的泛化性能,但在现实应用时,往往还需要针对特定用例对模型进行微调。
新智元
2023-10-20
2770
DALL·E 3辣眼图流出!OpenAI 22页报告揭秘:ChatGPT自动改写Prompt
不仅不用烧脑去想Prompt,而且还能直接配文,出图惊艳效果着实碾压了Midjourney。
新智元
2023-10-20
3750
Neuralink人体试验刚开,虐猴惊悚细节就被曝光!前员工指认老马撒谎,动保组织请求SEC调查
昨天刚刚宣布展开人体实验的Neuralink,马上就被自己的老冤家——动物保护组织PCRM告到了美国证监会(SEC),他们认为马老板在9月初推上称,猴子活体实验中死亡的猴子,都「不是在植入过程中死亡」的说法,涉嫌证券欺诈!
新智元
2023-09-22
1800
全面取代Llama 2!Baichuan 2自曝史上最全训练细节
9月6日,百川智能宣布正式开源Baichuan 2系列大模型,包含7B、13B的Base和Chat版本,并提供了Chat版本的4bits量化,均为免费商用。
新智元
2023-09-19
5830
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档