首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

常见的模型评测数据

开源模型评测排行榜 https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard 其数据是由其后端lm-evaluation-harness...创建该数据是为了支持对需要多步骤推理的基本数学问题进行问答的任务。 GSM8K 是一个高质量的英文小学数学问题测试,包含 7.5K 训练数据和 1K 测试数据。...数据分为挑战和简单,其中前者仅包含由基于检索的算法和单词共现算法错误回答的问题。我们还包括一个包含超过 1400 万个与该任务相关的科学句子的语料库,以及该数据的三个神经基线模型的实现。...CMMLU 是一个包含了 67 个主题的中文评测数据,涉及自然科学、社会科学、工程、人文、以及常识等,有效地评估了模型在中文知识储备和语言理解上的能力。...GAOKAO-Bench https://github.com/OpenLMLab/GAOKAO-Bench Gaokao 是一个中国高考题目的数据,旨在直观且高效地测评模型语言理解能力、逻辑推理能力的测评框架

1.3K10

机器学习的十图像分类数据

为了帮助构建对象识别模型,场景识别模型等,编制了最佳图像分类数据的列表。这些数据的范围和大小各不相同,可以适应各种用例。此外数据已分为以下几类:医学成像,农业和场景识别等。...医学图像分类数据 1. 递归蜂窝图像分类 –此数据来自递归2019挑战。竞赛的目标是利用生物显微镜数据开发可识别复制品的模型。关于比赛的全部信息可以在这里找到。...CoastSat图像分类数据 –用于开放源代码海岸线测绘工具,该数据包含从卫星获取的航空图像。数据还包括与标签有关的元数据。...室内场景图像 –来自麻省理工学院的该数据包含15,000多个室内位置图像。该数据最初是为解决室内场景识别问题而构建的。所有图像均为JPEG格式,已分为67类。每个类别的图像数量有所不同。...TensorFlow Sun397图像分类数据 –来自Tensorflow的另一个数据,该数据包含场景理解(SUN)基准中使用的108,000多幅图像。此外图像已分为397类。

8.5K11

拥有免费数据的十优秀网站

如果是一位尚未尝试过数据科学项目的初学者,那么从“没有经验”的起点到称为“专家”的非常理想的目的地的可能过渡只不过是数据。 使用具有各种主题的免费数据的所有这些网站具有许多优点。...这种讨论板被称为subreddits,或/ r /数据 - 一个分享,查找和讨论数据的地方。这些数据的范围和质量差异很大,因为它们都是用户提交的,但它们通常非常有趣且细致入微。...这些数据包括各种各样的数据,从流行的数据,如Iris和泰坦尼克号的生存,到最近的贡献,如空气质量和GPS轨迹。存储库包含350多个数据,其中包含域名,问题目的(分类/回归)等标签。...因此,这是数据聚合器,主要侧重于从科学论文中共享数据。它由两部分组成:用户可以搜索数据的站点,以及使共享数据可扩展且快速的BitTorrent主干。...它具有各种不寻常的(通常是的)数据,尽管在不阅读原始论文和/或在相关科学领域拥有一些专业知识的情况下获取特定数据的上下文有时会很棘手。 数据的重要性 ? 成为数据科学专家还有很长的路要走。

18K51
领券