首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ClickHouse的ontime测试数据集

《ClickHouse介绍》介绍了ClickHouse一些通用知识,《ClickHouse安装和使用》介绍了ClickHouse的安装,其实官网还提供了一些测试数据集,可以做更实际的验证工作。...官方文档给了很多示例数据集, https://clickhouse.com/docs/zh/getting-started/example-datasets/ontime/#sidebar-sidebar...-2-4 常用的就是OnTime,他是从https://transtats.bts.gov/下载到的数据集,记录了美国从1987年至今持续更新的的民航数据,可以方便的展示和进行PoC,一般用户的磁盘和电脑可以比较方便的体验和测试...统计表ontime的数据量,可以看到1亿数据,1毫秒, 可以检索均值,每次查询的时候,都会显示执行的进度,提示扫描时间、扫描数据量(行数、空间量)、扫描的速度(每秒扫描行数、每秒扫描空间量),如下图所示...,2.057秒扫描了1亿多行的数据,每秒扫描9千万行,每秒扫描260多MB的数据量, 还可以检索很多维度的数据,例如,从2000年到2008年每天的航班数, 查询从2000年到2008年每周延误超过

1.8K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大话测试数据(二):概念测试数据的获取

    在大话测试数据(一)文章中,我提到,获取数据的第一步是获取概念上数据。这一步看起来简单,其实不是那么容易。...勤学勤问勤练勤观察,入行几年后,如果不是特别懒惰,前三项都会提高到一个不错的高度。这些都变成了你的价值。经过一段时间爬坡,你就可以很快的获取概念测试数据了。...好吧,可以参考下面的干货资料(英文版,也正好练习下英文),你就当它是个 checklist,按图索骥吧:关于测试数据的获取(不仅仅是概念测试数据的获取),测试思路的获取,甚至是需求的获取,你一定会有收获...通过将测试人员的破坏性思维方式放在开发人员对架构,设计和代码的角度上,您可以挑战假设,也可以发现错误。特别注意从黑匣子角度可能无法理解的决策和路径。...所有这些都包含您可以用作灵感的信息。‎‎ 34.你!‎‎您的经验,知识,技能,感受,主观性和对问题的熟悉程度。您要测试什么?‎‎顺便说一句‎,在接下来的文章中,我将会着重讲解如何获取细化的测试数据。

    51030

    巧用R语言生成建模所需的测试数据

    前言 随机数用途多样,笔者常用于:生成测试数据,生成有规律的数列。...)\f换页符\n换行符\r回车符\t制表符(tab)\v垂直制表符注:\r\n是windows所用的文本行结束符,Unix和Linux只是用一个换行符来结束一个文本行匹配数字与非数字\d任何一个数字字符...但不能匹配换行\\转义字符,如果要匹配就要写成“\\(\\)”|表示可选项,即|前后的表达式任选一个^取非匹配$放在句尾,表示一行字符串的结束()提取匹配的字符串,(\\s*)表示连续空格的字符串[]选择方括号中的任意一个...(如[0-2]和[012]完全等价,[Rr]负责匹配字母R和r){}前面的字符或表达式的重复次数。...d 表示密度函数(density); p 表示分布函数(生成相应分布的累积概率密度函数); q 表示分位数函数,能够返回特定分布的分位数(quantile); r 表示随机函数,生成特定分布的随机数(random

    1.9K30

    【Code】OGB:图机器学习的基准测试数据集

    1.OGB 1.1 Overview Open Graph Benchmark(以下简称 OGB)是斯坦福大学的同学开源的 Python 库,其包含了图机器学习(以下简称图 ML)的基准数据集、数据加载器和评估器...OGB 包含了多种图机器学习的多种任务,并且涵盖从社会和信息网络到生物网络,分子图和知识图的各种领域。没有数据集都有特定的数据拆分和评估指标,从而提供统一的评估协议。...下图展示了 OGB 的三个维度,包括任务类型(Tasks)、可扩展性(Scale)、领域(Rich domains)。 ? 1.2 Dataset 来看一下 OGB 现在包含的数据集: ?...和数据集的统计明细: ? 1.3 Leaderboard OGB 也提供了标准化的评估人员和排行榜,以跟踪最新的结果,我们来看下不同任务下的部分 Leaderboard。 节点分类: ?...OGB 这样的多样且统一的基准的出现对 GNN 来说是非常重要的一步,希望也能形成与 NLP、CV 等领域类似的 Leaderboard,不至于每次论文都是在 Cora, CiteSeer 等玩具型数据集上做实验了

    1.5K30

    R语言中交集,并集,补集,差集的方法

    R语言中计算交集、并集、并集、差集,这些数学概念,这里汇总一下。包括向量的操作和数据框的操作。可以说是非常全面了。 首先,模拟一下数据:a为1-10的数,b为5-15的数。...向量 1. 1 交集(intersect) R中的函数为:intersect示例图:黄色线的区域,就是目标区域 # 交集 intersect(a,b) 1.2 交集(union) R中的函数为:...union示例图:黄色线的区域,就是目标区域 在这里插入图片描述 # 并集 union(a,b) 1.3 补集 R中的函数为:setdiff示例图:黄色线的区域,就是目标区域 # 补集 setdiff...(a,b) setdiff(b,a) a与b的补集: b与a的补集: 2....测试数据及代码 a = 1:10 b = 5:15 a b # 交集 intersect(a,b) # 并集 union(a,b) # 补集 setdiff(a,b) setdiff(b,a)

    2.8K21

    如何提取 R 语言内置数据集和著名 R 包的数据集

    大家好,今天我们来聊一聊在 R 语言中如何提取内置数据集,以及如何使用著名 R 包中的数据集。相信很多同学在学习 R 语言时,都会遇到需要用数据集来做练习或者分析的情况。...我们今天就一一讲解,带你走进 R 语言的数据世界! 1. R 语言自带的数据集 R 自带的数据集其实非常多,而且这些数据集涵盖了各种领域,比如统计学、医学、社会科学等。...提取著名 R 包中的数据集 除了 R 自带的数据集,很多常用的 R 包里也内置了数据集。对于生物或医学相关的研究,很多包会提供领域内的数据集,供用户进行模型验证或方法测试。...如何找到更多的数据集?——Rdatasets 如果你觉得 R 自带的数据集或者某个 R 包里的数据集不够用,别担心,还有一个专门存储 R 数据集的仓库,叫做 Rdatasets。...无论是 R 自带的 datasets,还是一些常见 R 包中的内置数据集,亦或是 Rdatasets 这种专门的仓库,都可以让我们轻松获取并使用各种数据集进行分析。

    19210

    victoriaMetrics无法获取抓取target的问题

    victoriaMetrics无法获取抓取target的问题 问题描述 最近在新环境中部署了一个服务,其暴露的指标路径为:10299/metrics,配置文件如下(名称字段有修改): apiVersion...注:vmservicescrape资源格式不正确可能会导致vmagent无法加载配置,可以通过第5点检测到 确保vmagent中允许发现该命名空间中的target 在vmagent的UI界面执行reload...,查看vmagent的日志是否有相关错误提示 经过排查发现上述方式均无法解决问题,更奇怪的是在vmagent的api/v1/targets中无法找到该target,说明vmagent压根没有发现该服务,...scrape_timeout__"] = swc.scrapeTimeout.String() ... } 继续跟踪代码,可以看到该标签是通过sc.KubernetesSDConfigs[i].MustStart获取到的...ports: - containerPort: 8080 protocol: TCP 总结 kubernetes_sd_configs方式其实就是通过listwatch的方式获取对应

    1.2K20

    R语言中交集,并集,补集,差集的方法汇总

    交集、并集、补集、差集,这些在R语言中如何实现呢,这篇博客介绍一下。 首先,模拟一下数据:a为1-10的数,b为5-15的数。...向量 1. 1 交集(intersect) R中的函数为:intersect「示例图:黄色线的区域,就是目标区域」 # 交集 intersect(a,b) 1.2 交集(union) R中的函数为...:union「示例图:黄色线的区域,就是目标区域」 在这里插入图片描述 # 并集 union(a,b) 1.3 补集 R中的函数为:setdiff「示例图:黄色线的区域,就是目标区域」 # 补集...setdiff(a,b) setdiff(b,a) a与b的补集: b与a的补集: 2....测试数据及代码 a = 1:10 b = 5:15 a b # 交集 intersect(a,b) # 并集 union(a,b) # 补集 setdiff(a,b) setdiff(b,a)

    2K10

    机器学习数据集的获取和测试集的构建方法

    第二篇,会介绍下如何获取数据集和构建测试集的方法。前者,对于机器学习来说,数据集的好坏对模型性能有很大的影响。而后者,主要是避免两个偏差--数据透视偏差和采样偏差。 ---- 2....获取数据 2.1 常用数据集 在我们学习机器学习的时候,最好使用真实数据,即符合真实场景的数据集,而不是人工数据集,采用这种人工数据集在实际应用中会让系统表现很糟糕,因为人工数据集一般都和真实场景下的数据有较大的差异...幸运的是,现在有非常多的开源数据集,并且涵盖了多个领域,这里介绍几个常用的可以查找数据集的网站以及一些在计算机视觉常用的图像数据集: Kaggle 数据集:每个数据集都是一个小型社区,用户可以在其中讨论数据...2.3 创建测试集 在下载数据后,首先要做的是创建测试集,这是在分析数据前先排除测试集的数据,不会引入测试数据的规律,从而影响算法的选择,保证采用测试集进行测试的结果是客观可信的,而不会出现数据透视偏差的问题...---- 小结 第二篇,先介绍了几个寻找数据集的网站,和计算机视觉常用的图像数据集,然后介绍如何划分测试集,避免数据透视偏差和采样偏差的问题。 点击原文,可以查看数据集的链接。

    2.5K40

    windows2012 R2群集的磁盘变raw无法格式化的解决

    现象:非正常删除windows2012 R2故障转移集群后,重新安装系统后,发现磁盘变成RAW并且联机后格式化无法顺利完成。 ? 格式化无法完成,删除卷提示被使用 ?...Windows Cluster中的SCSI锁: Windows 2003集群中使用SCSI-2 reserve/release命令。...SYSTEM\CurrentControlSet\Services\ClusDisk\Parameters \Signatures 获取该列表后,群集服务将尝试扫描所有的设备上共享的 SCSI 总线以查找匹配的磁盘签名...群集服务和任何资源,任何节点,无法交流,无法维护或获得仲裁磁盘的所有权将终止该节点的承载将会被移动到群集中的另一个节点。 目前拥有仲裁磁盘的节点是保护节点。...只要群集的磁盘资源脱机,群集中,资源指向 (具有匹配签名的磁盘) 的卷将无法访问任何群集节点上的操作系统。

    2K21

    解决calamari无法获取节点信息的bug

    一、前言 一直在做calamari的相关的一些打包和安装的工作,都是业余弄的东西,所以并没有仔细的进行功能点的验证测试,正好ceph社区群里面有人问了个问题 calamari上是不是能看到ceph的version...以后,这个文件会被更新,然后权限又变成无法读取的 2.2 相关知识补充 Grains - salt-minion 自身的一些静态信息 salt '*' grains.ls # 查看 grains...,salt-minion在进行重启的时候会将一些静态的信息推送到salt-master上面去,而这个生成的信息正好就是我们上面提出有权限问题的data.p这个存储的文件的,那么解决问题就是修改这个地方的权限的问题了...salt-minion 检查权限,已经看到权限变成了644了 [root@lab8106 ~]# ll /var/cache/salt/master/minions/lab8106/data.p -rw-r-...-r-- 1 root root 5331 Jan 9 15:33 /var/cache/salt/master/minions/lab8106/data.p 现在再看下前台页面效果: ?

    96120

    R tips:手动获取函数的源码

    R中的函数分为普通函数、S3方法和S4方法。 普通函数的源码获取细节 普通函数的源码手动获取比较简单,只需要在console中输入函数名,打印一下即可。...<- as.character(substitute(name)) # get(name, envir = asNamespace(pkg), inherits = FALSE) #} 在R中...,base包的::、[ 等操作符,colnames的%>%、%$%等操作符都是函数,由于他们不是合法的R变量名称(只包含数字、英文字母...S3方法源码 S3方法的源码的获取可以手动构造一下函数名称,然后在console中打印它即可,之所以需要手动构造方法名称是因为一个S3泛型函数直接打印的并不是真正的源码细节。...S4方法源码 不同于S3方法,S4方法源码无法通过构造函数名称来获取,但是methods包(R的官方S4类包,默认自动导入)中提供了getMethod方法来获取源码。

    94010

    一些算法的小结

    具体的方法有: 最小二乘法 梯度下降法 3、衡量回归效果的指标——R^2 R^2=SSR/SST (回归平方和/总离差平方和) R^2——[0,1],越接近1说明回归平方和在总离差平方和中的占比越大,...reg.coef_#用来获取训练出来的回归方程的斜率 reg.intercept_#用来获取训练出来的回归方程的截距 reg.score(feature_test,target_test)#用来获取回归方程在测试数据上的...R平方 reg.score(feature_train,target_train)#用来获取回归方程在测试数据上的R平方 ---- 02|决策树: 1、决策树是什么 决策树(Decision Tree)...2、算法原理/步骤 首先需要找到影响分类的变量(特征),然后给这些特征进行优先级排序,根据优先级顺序依次进行分割, 直到每个分支下的数据都属于同一类型,无法再进行分割时,分割结束,算法结束。...在划分数据集之前之后信息发生的变化称为信息增益,我们可以计算每个每个特征值划分数据集获得的信息增益,获得信息增益最高的特征就是最好的选择。

    67140

    SQL语句执行与结果集的获取

    数据库编程 keywords: OLEDB, 数据库编程, VC++, 数据库,执行SQL, 获取结果集 --- 上次说到命令对象是用来执行SQL语句的。...数据源在执行完SQL语句后会返回一个结果集对象,将SQL执行的结果返回到结果集对象中,应用程序在执行完SQL语句后,解析结果集对象中的结果,得到具体的结果,这次的主要内容是如何解析结果集对象并获取其中的值...SQL语句获取结果集并设置COMMANDUI对象的属性。...列信息的获取 取得结果集对象后,紧接着的操作一般就是获取结果集的结构信息,也就是获取结果集的列信息(有些材料中称为字段信息)要获取列信息,就需要QueryInterface出结果集对象的IColumnsInfo...SQL语句后,得到一个结果集,然后调用对应的Query方法,得到一个pIColumnsInfo接口,接着调用接口的GetColumnsInfo方法,获取结构的具体信息。

    3.9K20

    proc 编程处理 select 获取的数据集

    使用 select 语句获取数据,有两种种结果,第一种,得到的结果只有一行,我们只需要用指定的变量来接收它就可以了,但第二种情况则是有多行数据,每一行数据,处理这种多行返回的数据也有两种方法,一个是使用一个二维宿主数组来接收这些结果...EXEC SQL select deptno, dname, loc into :deptno2, :dname2, :loc2:loc_ind from dept; // 获取通讯区的sqlerrd...select 返回的一组数据,但是这组数据的个数如果超过了我们定义的数组的大小,那么就无法接收更多的数据了。...,我们可以一行一行的读取数据进行处理,而这种方法也存在部分缺陷,那就是依次遍历整个结果集,却不能定向的指定要取哪部分数据,所以呢,下面的滚动游标应运而生。...6种方式来获取我们需要的数据,而不像之前的普通游标只能一行一行的读取了。

    20920
    领券