首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ChatGPT正在将非英语语言排除在人工智能革命之外

有外刊认为目前人工智能聊天机器人的自然语言和模型训练都以英语为主,有可能放大全球商业活动和学术创新中现有的偏见。

英语的主导地位在全球商业和学术圈中是真实存在的。比如说,如果你不用英语发表论文,你就可能被会边缘化。

研究者希望通过人工智能改变这一点,而不是进一步强化英语的主导地位。目前有全球人工智能研究人员团队正在测试ChatGPT及其竞争对手chatbots的语言技能,表示有证据表明这些人工智能工具英语以外的语言能力明显较差。

而且由于大多数英语聊天机器人在全球网络上的活跃,这种偏好将加剧,可能导致人们会遵循常规更加频繁使用英语,不去考虑自己的身份或文化。最终扼杀了多样性,扼杀了创新。

比如全球各个国家的员工都在求助于聊天机器人来帮助构思商业创意、起草公司电子邮件和完善软件代码。如果这些工具继续在英语语境中发挥最佳作用,它们可能会增加国际化商业人士学习英语的压力,导致英语影响力会螺旋上升。OpenAI也公开表示,大部分基础数据来自英语,该公司微调和研究模型性能的努力主要集中在英语上.

目前大型语言模型使用从互联网、书籍和其他资源中获取的数十亿个单词的文本中学习到的统计模式来处理单词。由于美国的经济优势和中国庞大的人口,更多的可用材料是英文和中文。但是也有研究多语言语言模型的研究者发现,要想更好地回答中文问题,需要用英语而不是中文提问。

目前国际上有部分研究人员还在创建新的非英语文本数据集,试图加速真正多语言模型的开发包括印尼语数据、非洲语言数据和拉丁美洲方言数据。不过研究者表示,除了研究之外,已经放弃使用ChatGPT和其他源于大型语言模型的工具来实现其他目的。这是因为其底层技术的设计,聊天机器人拥有“互联网上的平均水平”,这种水平在英语中效果最好,而在其他语言中则缺乏趣味。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230601A029YU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券