首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用好大数据筛查技术

银林坤

为保证污染源普查数据质量,应紧扣数据填报、数据审核等关键环节,有针对性地采取集中审核、交叉互审、分行业审核、大数据审核等多项举措,有效提高基础数据质量和数据审核通过率。

数据审核工作是普查中一项重要任务,应将数据审核工作贯穿数据采集阶段到核算阶段的整个过程。比如,广东省深圳市一是编制了9个重点行业的普查样表,提高入户效率和填报质量;二是编制工业源报表审核指引和工业源报表审核要点,为各区指明数据审核工作方向和着重点;三是编制线路板等10个产污量大或常见行业的行业审核要点,有针对性地提高各区数据审核效率;四是编制印刷等7个行业的软件审核规则,为省普查办开发审核软件提供素材。这4个方面共28份文件丰富了数据审核的技术指导资料,形成了一个相对全面的数据审核技术资料库,能够更好地服务于数据审核工作,为提升基础数据质量和审核通过率夯实技术基础。

此外,还可以利用大数据筛查技术强化数据质量提升工作。比如,深圳市将大数据技术的运用方向集中在数据完整性排查和合理性判断两个方面。

在数据完整性方面,一是利用大数据筛查技术,分行业统计废水表、VOCs表、其他废气表和危废表的全市填报率,将对应行业中产值较大却没有填报本行业中填报率较高的表格的企业抓取出来,形成疑似漏表企业名单,下发至各区核实整改;二是利用大数据筛查技术,研究原辅材料及能源表、一般固废表、危废表之间的关系,针对全市9个重点行业进行数值偏离度分析,将分析结果中数据偏离度较大的企业抓取出来形成待核实名单,要求各区核实整改,确保普查基础数据“不漏一个指标、不偏一个数字”。

在数据合理性判断方面,一方面,针对全市重点行业中涉水企业的原辅料填报进行文本频次分析,算出对应行业中各类原辅料的填报频次,逐一排查重点行业原辅料漏填情况。

另一方面,重点校核产排污核算表的核算环节,通过综合分析全市金属表面处理及热处理加工、电子电路制造、电线电缆制造等17个产污量大或数量占比大的行业的生产工艺表、原辅材料及能源表和产排污核算表,根据不同行业的工艺特点,找出3张表格之间的填报关系,整理成校核规则,用此规则对全市工业企业数据进行筛查,形成这3张表疑似错填、漏填的名单并下发至各区核实整改,尽可能降低产排污核算表核算环节漏算的可能性。

在数据核算阶段,要将提高“三率”(即数据核算完成率、审核通过率和准确率)作为践行“数据质量是普查第一生命线”的具体行动,建立准确、真实、完整的高质量普查数据库,为生态环境管理部门对数据的更好使用奠定基础。

作者单位:广东省深圳市第二次全国污染源普查工作领导小组办公室

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190905A0459T00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券