机器中文语言能力评测基准“智源指数”发布, AI大模型有了评测新基准
近日,北京智源人工智能研究院(以下简称“智源研究院”)在自然语言处理重大研究方向前沿技术开放日活动上发布了大模型评测的“命题”新方案 —— 智源指数(CUGE)。
“如果说自然语言处理是人工智能皇冠上的一颗明珠,建立科学的评价标准就需要寻找这颗明珠的本身,如果方向错了, 走的越远,偏离越多,很有可能就找不到。近十年里,自然语言处理突飞猛进,特别是超大规模预训练语言模型等技术的突破,英文语言能力评价基准发挥了至关重要的指引作用”,中国工程院院士、中国人工智能学会理事长、清华大学教授戴琼海院士...