首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

唐山烧烤店打人事件后,我们问了 AI 几个问题,得到一些「有趣」的答案

在一些事件中,连 AI 的价值观也优于部分人类。 作者 | 西西 编辑 | 陈彩娴 6月10日凌晨,河北唐山一家烧烤店内发生一起殴打事件,记录事件经过的视频流出,引起社会广泛关注。 据唐山市公安局路北分局初查,事件原委如下: 犯罪嫌疑人陈某志进入烧烤店内对正在用餐的四名女子中的一人进行骚扰并殴打对方,随后陈某志同行同餐人员刘某等冲入店内对受害人进行殴打,并将受害人拖至店外继续殴打。案发后,犯罪嫌疑人逃离现场。 目前,两名女子受伤,在医院住院治疗,两名主要犯罪嫌疑人被依法刑事拘留。 图注:唐山市公安局路北分

09

【AAAI2024】公平感知的Transformer模型结构剪枝

大型语言模型(LLMs)的不断增大引入了在它们的训练和推断中面临的挑战。移除模型组件被认为是解决大型模型尺寸问题的一种方法,然而,现有的剪枝方法仅关注性能,而没有考虑到对LLMs的负责任使用的一个重要方面:模型的公平性。对于多样化群体,如女性、黑人、LGBTQ+、犹太社区等,重要的是要关注LLMs的公平性,因为它们正在被部署并面向广泛的受众。在这项工作中,首先,我们研究了在基于预训练Transformer的语言模型中,注意力头(attention heads)如何影响公平性和性能。然后,我们提出了一种新的方法,用于剪枝那些对公平性产生负面影响但对性能至关重要的注意力头,即语言建模能力的关键头部。我们的方法在时间和资源方面具有实用性,因为它不需要对最终剪枝后的更公平模型进行微调。我们的研究结果表明,与有偏见的模型相比,DistilGPT-2、GPT2、两种不同尺寸的GPT-Neo、GPT-J和Llama 2模型的性别偏见分别减少了19%、19.5%、39.5%、34.7%、23%和8%,而性能只略有下降。警告:本研究使用了具有冒犯性质的语言。

01

大语言模型距离替代程序员还有多远?

“AI 助手”与程序员并肩工作的想法存在于我们的想象几十年了,它催生了来自编程语言Ferdowsifard et al. 2020; Miltner et al. 2019; Ni et al. 2021; Raychev et al. 2014和机器学习Guo et al. 2021; Kalyan et al. 2018; Xu et al. 2020社区的大量工作。由于大型语言模型(LLMs) Li et al. 2022; Vaswani et al. 2017的最新突破,这个梦想变得接近了。OpenAI的Codex模型Chen et al. 2021包含120亿个模型参数,训练了GitHub上5400万个软件库,能够正确解决30-70%的常规的Python问题,而DeepMind的AlphaCode Li et al. 2022在竞争性编程平台Codeforces上排名前54.3%,超过了5000名人类程序员。凭借这种令人印象深刻的表现,大型代码生成模型正在迅速逃离研究实验室,为工业编程助手工具提供动力,例如Github Copilot Friedman 2021。

01
领券