首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

常见的大模型评测数据集

创建该数据集是为了支持对需要多步骤推理的基本数学问题进行问答的任务。 GSM8K 是一个高质量的英文小学数学问题测试集,包含 7.5K 训练数据和 1K 测试数据。...,受 Winograd Schema Challenge(Levesque、Davis 和 Morgenstern 2011)的启发,进行了调整以提高针对数据集特定偏差的规模和鲁棒性。...数据集分为挑战集和简单集,其中前者仅包含由基于检索的算法和单词共现算法错误回答的问题。我们还包括一个包含超过 1400 万个与该任务相关的科学句子的语料库,以及该数据集的三个神经基线模型的实现。...CMMLU 是一个包含了 67 个主题的中文评测数据集,涉及自然科学、社会科学、工程、人文、以及常识等,有效地评估了大模型在中文知识储备和语言理解上的能力。...GAOKAO-Bench https://github.com/OpenLMLab/GAOKAO-Bench Gaokao 是一个中国高考题目的数据集,旨在直观且高效地测评大模型语言理解能力、逻辑推理能力的测评框架

7.1K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【深度学习】PyTorch 数据集随机值的完美实践

    ds = DataLoader(ds, 10, shuffle=False, num_workers=4, worker_init_fn=worker_init_fn) 01 关于pytorch数据集随机种子的基本认识...在pytorch中random、torch.random等随机值产生方法一般没有问题,只有少数工人运行也可以保障其不同的最终值. np.random.seed 会出现问题的原因是,当多处理采用 fork...方式产生子进程时,numpy 不会对不同的子进程产生不同的随机值....,即程序运行后的初始随机值,其可以通过以下两种方式产生 torch.manual_seed(base_seed) 由特定的seed generator设置 generator = torch....0, 19623, 21744]]) ============================================================ 假设上述方案对一个时代内可以防止不同的工人出现随机值相同的情况

    55930

    记录级别索引:Apache Hudi 针对大型数据集的超快索引

    元数据分为四个分区:文件、列统计信息、布隆过滤器和记录级索引。 元数据表与时间轴上的每个提交操作同步更新,换句话说,对元数据表的提交是对Hudi数据表的事务的一部分。...通过包含不同类型元数据的四个分区,此布局可实现多模式索引的目的: • files分区跟踪Hudi数据表的分区,以及每个分区的数据文件 • column stats分区记录了数据表每一列的统计信息 • bloom...写入索引 作为写入流程的一部分,RLI 遵循高级索引流程,与任何其他全局索引类似:对于给定的记录集,如果索引发现每个记录存在于任何现有文件组中,它就会使用位置信息标记每个记录。...在涉及针对记录键列进行相等性检查(例如,EqualTo 或 IN)的查询中,Hudi 的文件索引实现优化了文件裁剪过程。这种优化是通过利用 RLI 精确定位完成查询所需读取的文件组来实现的。...写入延迟 在第一组实验中,我们建立了两个管道:一个使用 GSI 配置,另一个使用 RLI 配置。

    65210

    cypherhound:一个针对BloodHound数据集的终端应用程序

    关于cypherhound cypherhound是一款功能强大的终端应用程序,该工具基于Python 3开发,包含了260+针对BloodHound数据集的Neo4j密码。...除此之外,该工具还可以帮助蓝队研究人员显示有关其活动目录环境的详细信息。...功能介绍 cypherhound专为处理BloodHound数据而设计,并包含下列功能: 1、支持264种密码,可以根据用户输入(指定用户、组或计算机成员)设置要搜索的密码,支持用户定义的正则表达式密码...- 输出文件名称,不需要写后缀名 raw - 写入元数据输出(可选) example export 31 results export...- 用于显示此帮助菜单 (向右滑动,查看更多) 注意事项 1、该程序将使用默认的Neo4j数据库和URI; 2、针对BloodHound 4.2.0构建; 3、Windows用户必须运行:pip3

    32210

    如何用4行 R 语句,快速探索你的数据集?

    你需要了解缺失数据的多少,以及它们可能对后续分析造成的影响。 如果某个变量的缺失数据少,干脆把含有缺失值的行(观测)扔掉就算了,免得影响分析精确程度。 但如果缺失数据太多,都扔掉就不可行了。...这个数据集,来自于 Hadley Wickham 的 github 项目,名称叫做 nycflights13 。 ?...但是,由于观测(行)数量众多,我们很难直观分析出缺失值的情况,以及数据的分布等信息。 第4条语句,就是负责帮助我们更好地检视和探索数据用的。...对于定量数据,直接汇报最大、最小、均值、中位数等信息。 第六列是有效值个数;与其互补,第七列是缺失值个数。 第四列是频数。显示每一个变量对应独特取值出现的情况。...探索 本文介绍的 summarytools 包的功能,并不只是对数据集做总体总结概览。 它还可以进行变量之间的关系展示。例如你想知道3大机场起飞的航班,对应航空公司的比例是否有差别。

    90110

    两个看似奇怪的MySQL语句问题

    今天同事给了我一个文件需要更新下CMDB的数据,提供的内容是excel的形式,因为条目比较多,我需要做一些转换,批量修改成对应的SQL语句,因为只有我知道这个逻辑,所以这个转换工作由我来做。...本来看起来很简单的一个问题,结果因为不经意的操作出了两个问题,会牵扯出来两条有趣的SQL问题。...列给刷新,标记为0和1,如果映射到了就是1,否则就是0,但是真正的数据没有正常变更。...修改语句之后,数据还是没有变更过来,这个时候碰到了一个诡异的问题, 上面的update语句手工拷贝过来能够正常执行,但是在文本里就不可以。反反复复试了多次,还可以复现,让我都有些怀疑人品了。...码值,同理,1对应的是31,而09对应的是制表符,也就是\t这样的符号,是不可见的。

    1.1K70

    如何对应两个不同单细胞数据集的分群结果?

    首先,来问问你的私人顾问人工智能大模型kimi kimi(https://kimi.moonshot.cn/):两个不同数据集的单细胞降维聚类分群结果如何对应?...在单细胞转录组学研究中,将两个不同数据集的降维聚类分群结果进行对应是一个常见的问题,尤其是在跨样本、跨物种或跨实验条件的研究中。以下是几种常用的方法来实现这种对应关系: 1....基于标记基因的对应(Marker Gene Matching) 如果不想进行数据整合,可以分别对两个数据集进行降维和聚类,然后通过标记基因来寻找对应的细胞群。...操作步骤: 分别降维和聚类:对两个数据集分别进行降维和聚类。 计算相似性:计算两个数据集中聚类之间的相似性(如Jaccard指数)。 匹配聚类:根据相似性得分找到最匹配的聚类。...总结 选择哪种方法取决于具体的研究需求和数据特点: 数据整合:适合需要统一分析两个数据集的情况,能够消除批次效应。 标记基因匹配:适合已知标记基因且不想进行数据整合的情况。

    12110

    SQL语句执行与结果集的获取

    数据源在执行完SQL语句后会返回一个结果集对象,将SQL执行的结果返回到结果集对象中,应用程序在执行完SQL语句后,解析结果集对象中的结果,得到具体的结果,这次的主要内容是如何解析结果集对象并获取其中的值...针对有的SQL语句,我们并不是那么关心它返回了那些数据,比如说Delete语句,insert语句,针对这种情况我们可以将对应返回结果集的参数设置为NULL,比如像下面这样 pICommandText->...这些属性必须在执行SQL语句得到结果集的操作之前定义好。因为在获得数据源返回的结果集的时候数据源已经设置了对应的属性。...结果集对象 结果集一般是执行完SQL语句后返回的一个代表二维结构化数组的对象。这个结构化对象可以理解为一个与数据表定义相同的一个结构体。...所以在绑定时候可以灵活的指定返回那些数据,返回数据长度是多少,针对特别大的数据,我们可以指定它只返回部分,比如只返回前面的1K 使用绑定可以灵活的安排返回数据在内存中的摆放形式。

    3.9K20

    Excel查找值技巧,根据两个值来查找相对应的值

    如下图1所示,要根据代码和编号两个值来查找对应的数量。 图1 有三种解决方案来实现目的: 1.连接关键值。此时,可以使用辅助列,也可以使用数组公式。 2.SUMIFS函数。...此时,返回的值必须是数字。 3.OFFSET函数。此时,如示例中的代码列排好序才能实现。...连接关键值 如下图2所示,在编号列和数量列之间插入一个辅助列,然后输入公式: =A2 & "-" & B2 向下拖动复制到数据末尾。...,然后使用查找函数来查找相对应的值。...将上述两个返回值作为OFFSET函数的参数,返回要查找的单元格区域,作为VLOOKUP函数的参数,最后返回相对应的值。 当然,这样的公式也需要数值排序如示例一样。

    2.8K40

    机器学习的十大图像分类数据集

    为了帮助构建对象识别模型,场景识别模型等,编制了最佳图像分类数据集的列表。这些数据集的范围和大小各不相同,可以适应各种用例。此外数据集已分为以下几类:医学成像,农业和场景识别等。...医学图像分类数据集 1. 递归蜂窝图像分类 –此数据来自递归2019挑战。竞赛的目标是利用生物显微镜数据开发可识别复制品的模型。关于比赛的全部信息可以在这里找到。...CoastSat图像分类数据集 –用于开放源代码海岸线测绘工具,该数据集包含从卫星获取的航空图像。数据集还包括与标签有关的元数据。...室内场景图像 –来自麻省理工学院的该数据集包含15,000多个室内位置图像。该数据集最初是为解决室内场景识别问题而构建的。所有图像均为JPEG格式,已分为67类。每个类别的图像数量有所不同。...TensorFlow Sun397图像分类数据集 –来自Tensorflow的另一个数据集,该数据集包含场景理解(SUN)基准中使用的108,000多幅图像。此外图像已分为397类。

    8.9K11

    【知识星球】颜值,自拍,美学三大任务简介和数据集下载

    欢迎大家来到《知识星球》专栏,今天给大家介绍三个任务,提供三个美学相关的数据集的下载,其中两个和人像有关,一个和通用的美学任务有关,下载可以进入知识星球自取,相关的项目,我们以后会在知识星球中进行研究和讨论...这是研究AI美学必备的数据集,而且网上很难找到下载,笔者曾经花了一个月才下下来,希望大家喜欢,勿要传播。 2 颜值评分 ?...正因如此,颜值算法才有了可行性,因此国内各大公司都开发了颜值打分应用。 总的来说,颜值和肤色,脸型,装饰等都有很大的关系。研究方向可以从传统算法和深度学习方法两个方向讲述。...这是一个人脸颜值数据集,共5500个正面人脸,其中4000个亚洲人脸,评分为0~5分。...如果你想试试利用算法来提高自己的颜值,不如来试试这个数据集吧!

    1.3K10

    拥有免费数据集的十大优秀网站

    如果是一位尚未尝试过数据科学项目的初学者,那么从“没有经验”的起点到称为“专家”的非常理想的目的地的可能过渡只不过是数据集。 使用具有各种主题的免费数据集的所有这些网站具有许多优点。...每个人都知道Reddit是一个受欢迎的社交新闻网站,但也有一节致力于分享有趣的数据集。这种讨论板被称为subreddits,或/ r /数据集 - 一个分享,查找和讨论数据集的地方。...这些数据集包括各种各样的数据集,从流行的数据集,如Iris和泰坦尼克号的生存,到最近的贡献,如空气质量和GPS轨迹。存储库包含350多个数据集,其中包含域名,问题目的(分类/回归)等标签。...因此,这是数据聚合器,主要侧重于从科学论文中共享数据集。它由两部分组成:用户可以搜索数据集的站点,以及使共享数据可扩展且快速的BitTorrent主干。...它具有各种不寻常的(通常是大的)数据集,尽管在不阅读原始论文和/或在相关科学领域拥有一些专业知识的情况下获取特定数据集的上下文有时会很棘手。 数据集的重要性 ? 成为数据科学专家还有很长的路要走。

    22.3K51

    cytof数据处理难点之合并两个不同panel的数据集

    去除细胞效应和基因效应 06.单细胞转录组数据的降维聚类分群 07.单细胞转录组数据处理之细胞亚群注释 08.把拿到的亚群进行更细致的分群 09.单细胞转录组数据处理之细胞亚群比例比较 以及各式各样的个性化汇总教程...我们可以开始尝试分析一些文献的公共数据集啦,不过在处理那些数据的过程中,我们还需要传授给大家几个小技巧。...合并两个不同panel的cytof数据集 有一些情况下,你的同一个实验项目的多个FCS文件,它们的抗体顺序并不一致。...prepData(fs, panel, md, features = panel$fcs_colname) rowData(sce1)[,1] rowData(sce2)[,1] 可以看到,两个数据集的...SingleCellExperiment对象就包含了两个不同panel顺序的cytof数据集啦。

    1.7K20
    领券