首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】SafeEdit - 大模型解毒知识编辑基准

浙江大学与蚂蚁集团等机构合作构建的SafeEdit数据集,旨在探讨知识编辑技术对大型语言模型解毒的可行性。该数据集包括4,050个训练样本、2,700个验证样本和1,350个测试样本,覆盖九种不安全类别,如法律、政治敏感、伦理道德等,并提供强大的攻击提示以诱导模型产生有害内容。SafeEdit的设计考虑了模型对恶意输入的防御成功率、对新型恶意输入的泛化防御能力,以及模型对正常用户请求的响应能力。该数据集为研究LLM的排毒问题提供了新的数据和评估框架,有助于推动该领域的发展,并可以应用于多种方法,如监督式微调、强化学习和知识编辑方法。

详情请参见五号雷达:https://www.5radar.com/result?key=SafeEdit

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OW6imQsgnuWl3rwsG-Q3cPIw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券