去人化记录技术

  • 1
    关注“腾讯产业互联网学堂”公众号加群互动有好礼相送
  • 2
    向学习君回复口令“去人化记录”
  • 3
    加入TVP专家交流群,获得课程福利
腾讯产业互联网学堂微信公众号
“腾讯产业互联网学堂”微信公众号

讲师简介

白慧冬

北京青宁信安科技有限公司CEO / 腾讯云最具价值专家(TVP)

物件身份证技术发明人,创立青寕信安科技有限公司,曾在中国电信集团公司任职,后来在中科院自动化所从事模式识别技术研究,CSDN特约专家、测试时代/领测软件测试网特约专家、曾任CSDN软件工程/管理版总版主9年(2001-2009年)。最近几年主要积累的是能源管理的人工智能分配算法与技术研究,动物穿戴和生命体征监测产品,通信技术及终端实现技术,物联网及目标身份标定技术,模式识别和行为分析为主导的智能交通以及安防体系构建,全程建模方法论的细节实现、软件开发心理学、人性化软件开发管理、软件度量技术——用于抽象化脑力劳动的量化模型。 2003年电子工业出版社出版了《软件工程之全程建模实现》一书第一版,2010年在机械工业出版社出版了第二版。 曾参与构建中国教育电视台云计算平台,后来参与构建设计某公司车联网云计算平台,现在在推进畜牧业及动物云计算平台的形成,搭建中国乃至全世界的动物血缘关系图谱,形成动物疾病的发现及疫情控制用的云计算处理中心,实现全网全球化的动物疾病和生活习惯乃至自然环境及水土保持的可持续发展的生态环境体系,发明新型动物行为学记录分析设备,为实现跨物种的语言互通技术,让人类可以和动物进行直接实现语音行为的沟通奠定了基础。

简介

《去人化记录技术》——1、数据记录时的人为错误;2、数据记录的故意延迟,使得数据失效;3、数据不记录;4、数据篡改 在这次疫情中,我们看到了早期地方政府基于自身保护的需求对CDC的专家没有说出实情的问题,我们也看到了很多养殖企业在动物用药和激素上撒谎造成肉类上面的激素用量超标。同样的问题我们经历了很多,也看过很多,我们怎么避免这些问题呢?这个去人化的记录技术,就是用来解决这个困境的。该技术首次提出是在2018年8月份,

讲义

一、记录技术的历史。

1、结绳起源(人类最初的记录方法)

方法已经失传,因为我们现在不知道绳结长度、大小、形状以及编制方式,到底是什么意思,但当时的人就是用这样的方式来做。绳子是人类的历史发展中的一个非常重要的工具,有了绳子后,人类的行动半径极大拓展了,我们可以跨越桥梁、河流、高山,让人类的步伐走得更远,于是人类最早的记录形态就从这里出现了。当时没有文字,没有其他的可以考证的文字描述,我们不知道打这个结到底是什么意思,这就是两种技术相互间隔,进行转换过程出现的一些形态。很多老的技术会失传,彻底失去它的作用,慢慢就没有人知道,也不需要人再去学习,那它就会真正消失。

2、文字的起源(书画同源,从表形进入表义)

文字逐渐出现的过程:甲骨文(象形字)、小篆、楷书、简体。“日、月”涉及甲骨文的象形文字到小钻到楷书到简体字的整个转化过程,所以在中国叫做书画同源。因为最早我们的文字就是画,小孩子从画字过程逐渐训练成对现代简体字的识别过程,这是一个相当困难的转化过程,是一个非人性化过程。人性化的过程就是照着样子画出来,非人性化的过程,是为了将来提高效率,但是短时间内孩子从什么都不知道到简体过程,直接跨越人类几千年的历史,甚至可以说上万年的历史,这个过程对于孩子来说是一个相当难以通过的过程,但不用担心每一个孩子都能走过去,除了极少数因为疾病带来问题的孩子,那些孩子,我们也在关注。

文字的变迁变得越来越抽象,但是书写效率越来越高。当计算机普及以后大家都在打字,提笔忘字的现象很多,实际上是一个转化过程,是科技力量对人类记录技术的转化过程,让你慢慢可以忘掉很多东西,不需要再去记忆很多最基础的事情,这些东西都由计算机帮你记住,你只需要做好最基础的训练,知道如何使用这些工具就足够了。

3、铁笔记史(史官记史即纪实)

在中国历史上最有名的记录的东西就是史书,按照一些史书或书籍的记载,在夏朝的时候就已经设立了史官。在中国古代有人说过史官记史是不允许当朝皇帝查阅的,但你知道这是不可能做到,毕竟史官是由皇帝/最高领导人来任命。那如何保证史官真的就是笔笔纪实,没有办法保证,只能说我们相信他,但是相信是不可靠的。后来王朝的演进中,逐渐形成了检察机关,专门做检查。

史书记录的真实性,包括经史子集的真实性都开始受到质疑,需要多个不同来源的信息的共同认证才能认定。要保证一个东西的记录过程真的是真的,是真的很难的。

4、篡改与作伪(人类历史中的黑暗面)

唐太宗签注起居录开始,有人开始质疑史官记录的真实性。出现了史学中的疑古派。

中国各朝代修订前朝史,根据起居录和实录进行整理编纂。编纂的过程,难免有认知不同和观点不同的修改,让一切失去了真实性。比如:明朝的永乐大典、清朝的文字狱。

5、配置管理(软件行业的防丢失技术)

到了当代,有很多信息的真实性还存疑,存疑不代表它不是真的,只是没有其他东西证明它一定是真的。谈一下软件开发过程中的一个记录方式,配置管理。在十多年前,我就提到过,配置管理是最小化软件工程过程中除了代码以外,必须保留的关键过程。同样看一个团队的研发过程是否达到最小的规范程度或者最低的规范水平的时候,只需要看一点,配置管理是否做到位了,完整的做到位需要付出比较大的力量,但最基本的配置管理做到位,并不难,可惜的是国内小一半的公司实际上是没做到。

在配置管理里做到了:

代码管理,实现对代码不同版本的记录管理,实现不同场景下回滚操作。真正做好了的代码,应该是每天无数次的提交,提交的时候要标注上你在上面修订什么,和上一版本的差别是什么,这并不麻烦基本上在半分钟到一分钟之内就可以解决的事情,但这样的一步操作,很多人没有这个习惯。

文档管理,实现文档的不同版本的记录管理,修订记录时文档管理中工作量的重要体现。

计划管理,计划的变更、执行,进度的跟进和异常都需要进行记录,每一个版本的存留都会影响后续的开发工作。

风险管理,对风险的标记和排序,有利于集中精力解决较大的可以评估到的风险,一定程度上减少项目执行与计划的偏离度。

这四项管理就是一个最小化软件团队的基础过程,不仅是在软件开发中,在其他的项目中也是可以用。其实软件开发是人类下一代所有工作模式的提升,也就是说其他的所有工作都可能会被取消,只有软件开发将来会永远保存,这项工作具有持续性。

6、记录技术体系(记录、传输、展示、校验的传统记录体系。大量的时间和资源浪费与重复工作)

首先得有人先记录,其次要传输过去,传输完了后要把它存储在你的服务器上或者存储硬盘上,还要把它适当的展现,展现的过程可能是给领导、客户、用户看。这些过程都涉及到一个比较麻烦的事情校验,每一步都要进行校验,才能保证它的真实性,保证没有出错。在中国有句古语叫做好记性不如烂笔头,就是告诉你通过这样的记录,能够把我们大脑里的东西进行适度的清空,把很多信息发布出去,就可以深入思考更深的一些东西

大家可以思考两个问题:记录下的数据是不是可以直接用吗?有没有更好的更低成本的技术基础?

二、记录技术的新变革

1、区块链保障无法篡改(进入到普通人层面的防篡改技术)

1)让你找不到修改/删除的所有记录。

2)记录信息全程可追溯可查询。

3)智能合约保障

快递到付,拒收,不懂得什么是契约承诺,这是很多人都有的问题,代表着大家对于只要不到手,就随时可以改动的想法,影响是非常大的。只要东西我没有拿到,我的钱没有付出,我随时就可以对我前面所有的承诺做改变,那我们社会的混乱程度可想而知。所以一定要一套技术来保证它是无法篡改或者不能篡改的,一旦违约了就要承担相应的违约责任。例如支付转运费。

2、记录芯片保障数据真实(记录要完成数据记录,数据清洗,基础算法处理,数据转换)

怎么保证记录数据的真实有效性,通过各种传感器来实现,这些记录不需要人的手工记录。前面讲的史官,哪怕有再高的责任心,也会涉及到记录的东西的无效性。

比如用振动传感器,这时走了多少步,走去了哪里,直接通过振动传感是可以知道你的运动状态,加上位置传感器和距离传感器,我基本上可以判断出来你在哪个地点,或者你周边,假设把整个世界3D模拟的话就可以知道你走到哪里。

温度传感器会记住你所有的数据信息,到底有没有发过烧,体温有没有异常变化。不是说吃退烧药就能蒙混过关,因为这是一个全过程记录,只有这样才能保证病毒不会被人带到其他地方。这时你想做一些不良的事情也不太可能。记录的过程不能让人来做,一定是要由技术来完成,技术是为了帮助你真正更好的来解决人类整体的问题,而不是你一个独立个体问题。还有其他各种传感器,包括光传感器、距离传感器、视频、音频、压力等等。这些东西都要经过数据的采集,之后要做数据清洗,然后根据算法模型进行数据的抽取和数据过滤,就能获取到有效的数据,下一步是数据传输。

3、传输过程保障无人干预(传输过程的可靠性保障)

传输过程要做到无人干预的保障,所以要用HTTPS的加密方式,通过无线网络、移动网络把它传输到存储服务器上。这个过程相对来说比较简单,基本上都是由公用公共设施来完成的。

4、变革后的记录技术体系(以过程的唯一性加上空间的复用去掉了过去对时间的浪费)

变革后的体系就是记录,通过传感器来获取,根据设定的公认算法模型进行数据技术处理,这样处理完的数据是大家认可的。算法模型写入在硬件芯片,由硬件芯片自主完成,不需要人为干预。还是那句话,只要有人为干预的地方都有可能发生篡改和修改,都有可能它的数据是不可靠,只要没有人为干预,这个传输过程可以认为,通过两边的校验,就可以确认这个过程,不需要再做一次核查,数据存储下来,保证它不会被篡改就可以了。

过程是记录、传输、存储(去中心化的数据存储)、展现。数据展现是通过全面性的约定,在特定场景下不允许指定部分数据展示,在有些场景下,你可以针对你的专业点来进行部分的展示。这次疫情上,有人说在最开始一月初的专家组到来的时候,有些医护人员没有说实话,反映真实情况。就说明人是篡改东西的一个重要因素,因为种种利益或者其他的形态会带一些影响,在这里证明人是最不可靠的因素。我们更愿意相信技术本身进行记录的形态,才要做去去人化记录技术。思考题一:区块链到底是什么?思考题二:

如果要保证这个过程的可靠性,还需要哪些技术的支撑。去除Update和Delete,每次都是增加的一个新的版本,这和配置管理里,每一次都是新增的一个版本是非常相似或者相同的。这就是我为什么会把配置管理和区块链联系起来的原因,这是软件开发过程形成的新的技术的,而这个技术点其实对所有的行业都有参考价值或者借鉴价值,而不仅仅是对软件开发行业。

二、去人化记录链路技术

去人化记录就是要把人的干预因素彻底去掉,留下来的就是记录链路,以保证整个记录链路的安全可靠性,减少不必要的校验过程和繁杂过程。

1、记录体系(多传感器芯片结合形成新的记录体系)

从振动传感器获得运动姿态、运动数据,温度传感器可以得到环境、自身的温度变化信息。如何综合的世界传感器是需要我们考虑的。光传感器、距离传感器、视频传感器、音频传感器、其他传感器都有各自的用处。

2、传输体系(针对原始记录可靠数据的有效传输算法以及传输芯片形成新的传输体系)

在整个传输过程中,流程是这样,前端的数据进行加密封装后,传输到后端进行匹配,真正使用过程中的是由服务端发出数据,前端进行解密,数据传输的使用。这个链路过程中,不需要人参与,所以基本上可以保证是无人化。

3、存储体系(基于区块链的存储和校验体系,保障了信息的可靠安全性)

在存储过程中要用到的就是去中心化的存储,去中心化存储会带来很多的成本不同。我认为目前所操作形态下,去人化的记录技术是可以用这种去中心化存储方案。

咱们可能都知道,比特币所带来的计算周期现在越来越长,据说大概是去年的2019年的十月份的数据,一次比特币的交易需要几个小时才能做最后的确认,因为它每次都要所有的链路排查一遍,才能确认这个东西要记录下来的变化是多少,要把所有节点都排查到,这个成本太大了。

在我们这个数据里,它是可以做到,因为是一次性写入,中间不会再有修改,下一次的使用是一个新的使用,我这边就是原始数据,你可以拿这个数据去做任何的分析处理、建立模型,形成你的东西。现在我们只需要在一次读取时,确认这几个地方读取到的数据都是真实的,如果有一个服务器当掉,另外三个可以把这个服务器的数据重新全部还原出来,这样就能得到一个真正可靠全面的信息,这样的存储体系是安全稳定的。

思考题:这样的设备一次充电能运行多长时间?这是一个很重要的问题。如何做到更好的节能,如果能做到更好的节能,那一次充电所运行的时间就可以极大的延长,设备记录的有效性就可以持续不断把数据传输上来,而不需要中间再干预,毕竟当设备进行充电的时候,有可能是无法进行数据记录的。

四、硬件的成型与应用场景

1、医学领域(为病患和医生的日常提供记录)

在医学领域,一个医生给病人做了检查,形成一个治疗方案,病人拿到后,就去吃药或者接受治疗,治疗和吃药过程中应该有一个设备来做记录,体征记录,有了这些数据,才能知道吃完药之后,身体体征变化什么样。去人化的记录,去掉主观人为意识的这种技术形态越来越重要,在医学领域应该会形成一个大的趋势。

2、畜牧业(为动物的健康疾病进食用药提供记录)

在畜牧业,我曾经在2019年五月份活动中做过讲述,我们称之为去人化的畜牧业用药技术,去人化记录技术在畜牧业中的用药技术。人也是动物的一种,你吃了药或者打针之后,在一定时间之内你的心率、体温、运动状态都会有所变化,会符合一定的健康数据模型,或者用药数据模型,它会和你的体重、身高、年龄都有相应的关联关系,这不是一个简单的形态。服用药物、检测体征状态需要非常慎重,而这过程靠兽医来记录,那是无效,不可能一直跟着牛羊,盯着看,测体温如何,这一定是一个穿戴设备随时记录体温的变化形态和心率的变化,把数据传到云端进行校验,如果发现用药错误,立刻修改,一个是救了牛羊的命,还有避免了造假。

3、物流运输(为物流的封装运输转运分发接收提供记录)

物流运输,道路运输过程中,货物的坠物问题,我们可以解决,后面还可以加一些设施,如车载定位设备、库房出入设备、智能电子标签,不需要人为扫码,只要搬到库房里面,一个进出行为就可以解决,它会自动上传到数据库。

包括上车下车的记录,比如行驶过程中有东西掉了,司机是不知道,是非常大风险,如何来判断这些东西,如何来保证安全,这些东西都应该是自动完成的。所有东西还是一个想法,不要让人来参与记录,人可能会记错,不管是有意的还是无意的,这种错误都需要花费更多的成本来进行校验,校验的成本是最贵的,看看财务管理制度就知道,本来那么简单的一个记账工作,最后用出了四大会计师事务所,各种贪污腐败浪费了多少社会资源。

4、老人儿童安全(为老人儿童的健康、走失、查找提供记录)

现在确实孩子走失的数量少了,但还是有很多的风险,也包括老人,我们怎么才能让他回来。这其实是我这家公司成立之初的原因,我们现在也在不断努力着。

在这里一个是电池的无接触电量检测。现在老人儿童安全的设备,就一个问题就是电池往往是不够的,不管你在家待了多长时间,出门的时候有没有来得及记住去充电。另外一个就是电池电量问题,没有电卫星定位信息肯定就没有了,肯定找不到了,这就一系列的问题需要考虑。所以应用在这里,这种技术安全性就是用在的电池的检测和动态行为的报警上,这两点我们做了去人化的记录和一些模式识别的分析。

5、适用场景简析(为所有的主动性为物件、被控移动物件和固定物件提供记录)

适用场景,我们把它划分了三个大类:

1)主动行为物件

主动行为物件就是具有主动行为意识、自我意识的物件。人类也属于这类别,是主动行为物件大类之核心类别。

2)被控移动物件

可以移动的有价值、有一定重要性的物件称为被控移动物件。这个类别一般来说应用范畴比较广,比如公司的各种资产、各种快递快件都在这里面,这里面它可以分为高价价值的、低价值的物品。

3)固定物件

包括消防栓设备、侦测设备、水资源监控设备、路灯、树木等这些不能被移动的物件,这些物件有供电结构,所以它的电量不用发愁,而最不容易有供电结构其实是被控移动物件,除了有车载的,或者有电池,或者其他能源来供应电量,那其他剩下的东西都比必须实现超长续航,如果你实现不了的话,让人家三天两头充电,那就没有意义了。同样对于主动行为物件里面除了人类知道如何充电之外,对于其他的动物也是没有办法。

思考题:我们还有哪些场景最好是去人化的呢?人将来应该做些什么事情?

五、Q&A环节

1、去人化记录技术在智能家居里面是不是适应的项目较多。

不能说相对较多,应该说这些领域里面都可以用。智能家居是一个很好的应用点,但是家居里面的数据量并不是特别大,真正的场景在外面,在万千世界。家里面你如果想做的话,可以把健康、家庭环境以及你的日常生活的习惯,综合起来做,做完其实针对你个人。如果能把比如说武汉市所有的人或者相当一批人的日常的行为记不下来,比如说几点起床,这样形成大数据也是很可观的。但是这些数据还可以通过别的方式来做判断,比如微信上,什么时候打开微信看了第一条信息,这时候大概就知道在这之前多长时间起床了。因为常规来说,有很多人的习惯,就是一睁眼第一件事你就打开手机,先看微信上有没有信息,所以在微信上就一个侧面的验证效果。

全部评论
讲师/助教

评论

直播日历