首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

SAS-如何随心所欲的抽取样本

我们在处理大样本的时候,往往会遇到随机抽样的需求,在SAS中抽样的方法有一个专门的Proc过程步(Proc surveyselect),这个过程步可以简单快速的实现一些随机抽样,有时候我们的随机抽样并不是那么呆版的抽样,这个时候proc surveyselect可能就不那么好用了,比如我们要质检一批数据,每个数据集观测都不一样,需要从每个数据集中随机抽取100条记录,如果不足100条则全部抽取出来...这个如何用proc surveyselect实现呢?反正小编是不会!当然仅仅是这,其实小编还是可以用proc surveyselect过程步做出来的,只是在抽样前获取数据集观测数,进行判断...如果小于指定观测,直接输出结果,如果大于则用抽样过程步进行简单的抽样!

00

pt-table-checksum工具主从一致性检查修复

当我们在进行数据库的运维工作时,很多时候会出现主从数据不一致的故障,尤其是当我们的binlog格式没有选择row模式,当主库执行一些类似于replace select或者时间函数等不确定的随机函数时,会出现从库数据和主库数据不一样。复制线程同步的时候就会报错,运营人员抽取数据就不会准确,尤其是对数据的一致性和安全性较高的金融公司。这个时候我们就要借助percona公司的pt工具来进行处理,pt-table-checksum和pt-table-sync分别检验master-slave的数据不一致并修复,避免了人工分析并筛选binlog日志进行修复的繁琐。但是对于pt工具,版本之间的差异还是比较大,尤其是pt工具的3.0.4版本并不能很好的检测出来,故而分享这个坑给诸位一线人员。

01
领券