首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

常见的模型评测数据

开源模型评测排行榜 https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard 其数据是由其后端lm-evaluation-harness...创建该数据是为了支持对需要多步骤推理的基本数学问题进行问答的任务。 GSM8K 是一个高质量的英文小学数学问题测试,包含 7.5K 训练数据和 1K 测试数据。...数据分为挑战和简单,其中前者仅包含由基于检索的算法和单词共现算法错误回答的问题。我们还包括一个包含超过 1400 万个与该任务相关的科学句子的语料库,以及该数据的三个神经基线模型的实现。...CMMLU 是一个包含了 67 个主题的中文评测数据,涉及自然科学、社会科学、工程、人文、以及常识等,有效地评估了模型在中文知识储备和语言理解上的能力。...GAOKAO-Bench https://github.com/OpenLMLab/GAOKAO-Bench Gaokao 是一个中国高考题目的数据,旨在直观且高效地测评模型语言理解能力、逻辑推理能力的测评框架

2.7K10

机器学习的十图像分类数据

为了帮助构建对象识别模型,场景识别模型等,编制了最佳图像分类数据的列表。这些数据的范围和大小各不相同,可以适应各种用例。此外数据已分为以下几类:医学成像,农业和场景识别等。...医学图像分类数据 1. 递归蜂窝图像分类 –此数据来自递归2019挑战。竞赛的目标是利用生物显微镜数据开发可识别复制品的模型。关于比赛的全部信息可以在这里找到。...CoastSat图像分类数据 –用于开放源代码海岸线测绘工具,该数据包含从卫星获取的航空图像。数据还包括与标签有关的元数据。...室内场景图像 –来自麻省理工学院的该数据包含15,000多个室内位置图像。该数据最初是为解决室内场景识别问题而构建的。所有图像均为JPEG格式,已分为67类。每个类别的图像数量有所不同。...TensorFlow Sun397图像分类数据 –来自Tensorflow的另一个数据,该数据包含场景理解(SUN)基准中使用的108,000多幅图像。此外图像已分为397类。

8.6K11
领券