人民网知青岁月梁家河_政企数据共享到底难在哪儿

知青文化 09-09 阅读:27 评论:0
人民网知青岁月梁家河_政企数据共享到底难在哪儿,

本文来自民众号:经济观察报(ID:eeo-com-cn),作者:陈永伟,题图来自:视觉中国


在“大数据时期”,将散落在政府与企业手中的数据有用整合起来,主动挖掘其代价乃是大势所趋。


从一本“文科生读物”说起


头几天,和几个朋侪一同聊大数据题目。个中的一个做手艺的朋侪倏忽问我,“你最早是从哪儿晓得‘大数据’这个观点的?”我稍微整理了一下影象,回覆道:“应该是从涂子沛那本《大数据》那儿吧。”朋侪听罢,冲我滑头地一笑,说道:“嗯,我猜也是。你和我熟习的大部份文科生一样,也是从这本和‘大数据’没什么关联的书最先晓得大数据的。”


作为一个文科生,我确实感到了来自一名工科学生的深深“歹意”,也霎时领悟到了他要通报的“槽点”。是的,假如从手艺的角度看,这部让涂教师一鸣惊人的著作生怕除了题目和“大数据”相干外,确实和厥后我们所明白的“大数据”少有关联——纵然以最为宽松的眼力看,这部书生怕也只能算是一部大数据的案例集。而关于大数据的手艺基础和应有逻辑,书中则鲜有说起。只管如许的书会很对我如许的文科生胃口,但却很难入手艺人的高眼。


不过,这儿我照样想为涂教师的这部书说几句公道话。事实上,作为一本提高书,它的义务更应该是着重某些理念的转达,而不是像手艺手册那样让人们取得细节性的学问。从这个角度看,这本“更适合文科生浏览”的《大数据》应该是胜利的。它不仅在第一时间向人们提高了“大数据”这个观点,而且还引见了许多有意思的大数据案例。


在一切的这些案例中,最重要的可以就是在一最先报告的美国《信息自在法》的出台委曲。这段笔墨向读者展现了美国政府逐渐开放数据的大抵进程,虽不算长,但却很清楚。经由过程这段报告,我们得以清楚地看到美国的数据开放是怎样一起走来的。几年以后重读这段笔墨,我遽然有一些似莫名的熟习感。


事实上,在这部书出书后不久,“大数据”的观点就兴起了。跟着“大数据”海潮的袭来,我国政府也最先了数据开放、数据同享的进程,这段进程着实与书中所讲的美国故事有许多相似之处。固然,和美国的实践比拟,我国的数据同享进程另有异常鲜亮的特性,个中之一就是:不仅由政府向企业、个人公然数据,另有由企业向政府部门,特别是羁系部门同享数据。


这类双向的数据活动和同享,在很大程度上促进了政府与企业之间的数据同享,也对完成政、企协同治理起到了症结的作用。不过,和一切的新事物一样,这个进程也遭受了许多困难,遇到了许多课题。也许,在多少年后,会有一本更加厚重的书来纪录中国的这些实践。


政企之间完成数据同享的来由


为何政府与企业之间有必要完成数据的同享呢?就其最为基础的来由来看,这是由“大数据”的特性决议的。尽人皆知,所谓的“大数据”并不仅仅是数目巨大,还请求有高的维度。假如或人具有的数据维度是异常单一的,那末纵然这些数据从数目上来看异常巨大,其剖析代价也不会很高。


举例来说,曾经有一个朋侪花了很大的气力汇集了某个区域一切住民的姓名数据,然厥后找我议论可以做什么研讨。当时我就很遗憾地通知他,虽然汇集姓名数据的事变很巨大,但如许单维度的数据好像除了可以剖析出姓氏散布如许的简朴信息来,也难以做出更多的研讨。


不过,假如我们可以同时汇集到住民的岁数、收入、事变状态等其他信息,那末可以研讨的话题就一会儿增多了。比方,我们可以看看在一个区域的大姓住民,终究是不是是可以取得更高的社会地位和社会资本,进而取得更高的收入;还可以考核收入状态和起名习气之间的关联……绝不夸大地说,当维度扩大时,可以从中挖掘出的信息就会以几何级数增进,数据自身带来的代价也会大幅度提拔。


如今,政府和企业手中都控制着许多数据,但它们所控制的数据性子是各不雷同的。整体来看,政府部门控制的数据重要来自统计和因须要以政府气力举行的监测,比方产业普查数据、工商税务信息、实时气候信息等。这些信息,企业或个人都很难取得。纵然可以取得,其本钱也是巨大的。而企业手中控制的则是相对来说更加微观的数据,比方企业贩卖的品类、生意业务流水、消费者特性等。这些数据都很细碎,然则政府要实时取得,也是好不容易的。在这类状况下,假如企业和政府之间相互隔膜,仅应用本身的数据,那末所能到达的效力也会相对低下。


这里特别须要强调的是企业因缺少政府数据而遭到的影响。一方面,出于本钱的斟酌,企业难以汇集某些数据,这会使企业在数据应用上的效力大幅度下降。举例来说,一些物流公司出于调理目的,须要实时的、细分区域的天色信息,但企业依附本身的气力却难以取得这些信息。在这类状况下,企业就不能依据确实的天色信息举行精准的调理,只能退而求其次挑选比较隐约的调理计划,因而必将带来效力上的一定丧失。


另一方面,一些重要的政府数据缺失另有可以致使企业的某些事变难以一般、合规的获得展开,一个典范的例子就是网约车行业。如今,各地纷纭制订了对网约车羁系的细则。我注意到,在许多处所的细则中,都明文划定了刑满释放职员不能处置网约车的运营。我不想对这个划定自身是不是合理举行议论,单说在现行的前提下,网约车公司要根据这些划定礼貌对司机举行考核就是好不容易的。


一个人终究是不是犯过罪、是不是坐过牢,这是很隐私的数据,在一般的档案中并没有纪录,只要公安部门控制着相干的数据。假如公安部门不向网约车公司供应这些数据,那末网约车公司就基础不可以对相干信息举行有用的考核,也就更遑论要对这些划定予以严厉遵守了。


基于以上两点来由,作为现在最大范围数据的一切者,政府在满足执法律例的前提下,向企业开放其手中的数据是异常有必要的。这不仅可以大幅度增添企业的运营决议计划才能,显著提拔经济运转的效力,同时也可以协助企业更有用地举行合规运营,从而对社会治理发作有用的促进作用。


固然,在政府向企业开放数据的同时,企业将本身具有的部份数据分享给政府,协助政府增强羁系,也是异常有必要的。当前,新的企业、新的商业模式屡见不鲜,许多行业的状况都瞬息万变,这对政府的羁系和治理也提出了严峻的应战。


只管政府部门也针对响应的状况,增强了有关数据的汇集,但其滞后性是异常显著的,本钱也很高。举例来说,近年来同享单车异军突起,一方面有用缓解了人们的出行难,但另一方面也带来了乱停乱放、占道严峻等题目。政府花了很大的人力、物力举行整治,但在很长时间内效果并不好。个中的一个缘由就是,政府并不能确实控制企业对车辆的投放状态,因而就难以对症下药地科学挑唆整治职员。


针对这一题目,许多都市都做出了让同享单车数据接入羁系平台的请求,以保证羁系职员可以实时监控到各区域的单车投放状态。不少案例表明,如许的请求确着实很大程度上让单车的摆放次序取得了有用的革新。


政企之间完成数据同享的困难


只管从理论上讲,买通政府与企业之间的数据壁垒,实行政企的数据同享可以大幅革新数据的应用效力,让企业的运营效力和政府的治理才能同时取得比较大的改良,然则在实际当中,要真正做到这一点照样面临着不少的困难。


先看政府对企业同享数据的困难。从现在看,它面临的停滞要素重要有两个——


一是数据安全题目。政府手中的数据,有许多是触及国家安全,或许触及住民隐私的,这些数据假如开放给企业,很可以会激发不可控的效果。不少政府部门对数据的开放坚持疑虑,很大的一部份缘由就来自于此。


前面我们提过网约车合规须要公安部门的相干数据,我曾就这个题目请教过公安部门的相干专家。他们的回覆是:一个人是不是有前科,本质上是相称隐私的信息。当这个人刑满释放以后,他为了从新融入社会,会倾向于不让更多的人晓得这段汗青。而假如将数据开放给相干的单元,便可以会给他们的就业、生涯制作许多贫苦。在一定前提下反而可以激化社会矛盾,带来许多没必要要的题目。


公安的专家给出的这套来由也是很有原理的,但恰是由于这个缘由,客观上致使了网约车企业没法根据请求完成治理,也给其运营埋下了一定的隐患。这里面的复杂关联终究应该怎样处置惩罚,生怕照样值得思索的。


二是数据的口径题目。我们晓得,政府的数据是经由过程各个部门汇集的,每一个部门的数据汇集划定礼貌、流程都不尽雷同,这就构成了终究数据在口径上未必会一样。在传统的统计前提下,统计体系会将各个部门的数据先举行汇总清算,终究拿出一致的数据予以宣布。但如许的事变方式明显很难满足实时、正确公然数据的请求。


中国工厂:困境、挣扎与转型

我曾接收南边某市的托付,为该市做营商环境评价。在这个进程当中,须要10多个部门离别供应本身的最新数据。只管相干部门的同道表面上都很合营,但他们在供应数据时都不谋而合地表示出了犹疑。纵然供应了数据,也会对我千叮万嘱地说,万万不能走漏出去。我对他们的警惕立场很猎奇,曾找一名同道私自问过缘由。他给我的回覆是,这是各部门的原始数据,而未来统计局宣布的数据一定会和这有相差,假如有人质疑起来,可以会带来一些没必要要的贫苦。


再看企业对政府同享数据所面临的停滞。在我看来,现在最重要的困难也有两个——


一是可以的数据走漏的风险。


某航空公司的一名治理职员曾和我说起:根据划定,他们必须将一切的搭客数据都上传给羁系部门。但某一天,他发明羁系部门正在和一家第三方数据公司协作,将他们上传的数据交由这家数据公司运用。他对此感到很忧愁,由于搭客的数据都是异常隐私的,假如这些数据在被数据公司应用的环节中发作走漏,那末构成的效果将异常严峻。特别是假如走漏的信息触及到欧洲搭客,依据欧盟公布的《通用数据庇护条例》,即所谓的GDPR,航空公司将面临巨额的罚款风险。


我不能确认这位航空公司治理职员所说的状况是不是属实,但假如是真的,那末这个状况确实异常值得注重。从法理上讲,用户的数据是由公司收集的,它们就负有对这些数据举行保密的义务。现在,包含GDPR在内的多量执法律例都依据这点部署了异常严厉的执法义务。


然则,假如企业须要交给将数据上报给羁系部门,而羁系部门又把这些数据交给第三方,那就意味着企业将会面临着巨大的、不可控的信息走漏风险——纵然它们对内部的风控做得再严厉也没用。假如这个题目不妥善处理,那末企业的运营主动性就有可以遭到很大的负面影响。


二是对数据同享的赔偿题目。


我们晓得,在数字经济社会,数据已是重要的临盆资料,也是企业的重要计谋资本。为了数据的汇集和处置惩罚,企业每每须要投入巨大的本钱,而这些数据自身也能给它们带来响应的经济收益。假如政府只是请求企业将数据拿出来用于纯真的羁系用处,那末题目还不大。但假如政府像前面提到的案例那样,将数据给了第三方举行剖析或运用,那就很有可以对企业的临盆运营构成影响。基于这点,我个人认为,假如请求企业开放数据,那就好像是将企业的资产拿出来同享一样,假如不给予响应的赔偿,就很有可以袭击企业临盆、汇集数据的主动性。


不过,终究应该怎样对企业的同享行动举行赔偿,以多大金额举行赔偿,就又是一个难明的题目。虽然我们经常说数据代价巨大,但关于它终究能在市场上值个什么价,倒是不得而知的。事实上,由于如今在数据产权的认定题目上还没有一致的划定,数据的生意业务受限异常严峻。


市场上的大部份生意业务都是经由过程黑产情势完成的。如许构成的价钱完整不具有参考意义,很难代表数据的实在市场价钱。别的,纵然我们晓得了数据的市场代价,但关于同享给政府,重要用于羁系的数据,明显不能照此索价。因而,终究怎样对企业的数据同享行动举行赔偿,照样一个有待处理的困难。


三是由于数据同享带来的权益义务分派题目。


如今,大部份政府请求企业上传、同享数据的情况,都是为羁系目的效劳的。比方,交通部已请求网约车公司将司机个人信息、定单信息、运营信息、定位信息、效劳质量信息等数据都接入羁系平台——先由网约车平台公司将数据传输至部级平台,然后再由部级平台将数据实时转发至相干省级平台及都市羁系平台。如许做,固然是为了可以实时对网约车运营状态举行实时的监视,在出现题目时举行实时的干涉干与,其初志是异常好的。


不过,对如许的行动,我个人另有一些疑问。比方,当羁系部门可以实时监控到一切网约车的运营状态时,假如这些网约车的运营出了某些题目,那末羁系部门是不是是应该要负担响应的义务,而与此同时,网约车平台的义务是不是是应该响应的下降?假如羁系部门不负担义务,那好像在理论上说不通,由于我们可以说它已介入了羁系。假如羁系无足轻重,发作了题目没必要负担义务,那羁系又有什么意义呢?


但假如真要羁系部门负担义务,那好像又在实践上说不过去。我们晓得,交通部的职员异常有限,要面临全国网约车的实时数据举行监控,险些就是不可以的。假如出了事变就要他们负担响应的义务,那末羁系职员要背的“锅”就着实是太重了。


怎样进一步推动政企之间的数据同享


在“大数据时期”,将散落在政府与企业手中的数据有用整合起来,主动挖掘其代价乃是大势所趋。不过,正如我们所看到的那样,无论是由政府向企业同享数据,照样由企业向政府同享数据,在实践当中都邑遭受许多的困难。因而,为了进一步推动政企之间的数据同享,我们另有相称多的事变要做。具体来说,以下几点是比较值得注重的。


第一,应该推动与数据相干的立法,进一步明白在政府与企业之间,哪些数据可以同享,哪些数据应该同享。


所谓没有礼貌,不成方圆。正如涂子沛教师的那部《大数据》当中指出的,美国政府对政府数据的开放,是在一系列执法、律例建立的基础上实行的。从基础上讲,我国在政企数据同享中遭受的许多困难,也是由于相干的执法律例缺失所构成的。假如人们对本身的权益和义务不明白,那就很难展开活动。因而只要从执法的层面上落实数据开放划定礼貌,相干职员在举行操纵时才可以按图索骥,防止种种可以的停滞。


第二,在举行数据同享时,可以斟酌差别享原始数据,只同享数据产物或经由脱敏后的数据。


着实,在许多状况下,我们最须要的并非数据自身,而是由数据所天生的产物,比方数据运算的效果,或许由数据练习出的算法等。以羁系为例,在我个人看来,假如羁系者想要相识的只是实时发作的题目(比方网约车的变乱、纠葛等)数目,那末他们只须要让相干的企业在本身的平台上先运算出这些统计数据,然后再将这些数据提交给羁系平台就好了。


从杀青羁系的目的看,如许做的效果基础是和请求企业供应一切实时数据是等价的——事实上,斟酌到运算效力等题目,如许报告的效果可以还会更好。但与此同时,如许的做法又可以防止前面我们所提过的许多题目。像数据走漏风险、数据价钱题目,以及权责关联题目等,在如许的操纵下都将水到渠成。


第三,应该主动采纳种种新的手艺来破解数据同享进程当中采纳的题目。


从最基础的角度看,要处理数据相干的大多数题目,终究还要靠手艺的生长。我想,在当前的状况下,至少有两样手艺是有助于我们处理这个题目的。


第一项手艺是团结进修算法。


如前所述,我们如今须要大数据的最重要来由是,将更多的数据鸠合在一同后,便可以从它们身上挖掘出更多的信息。换言之,假如我们不须要将数据鸠合在一同便可以到达一样目的的话,就没必要再采纳这类整合数据的头脑了。如许的抱负可以完成吗?答案也许是一定的。


现在,谷歌正在研发一种团结进修手艺。和过去的种种机械进修算法须要集合在一同差别,团结进修算法可以应用疏散在成百上万万用户手里的装备,协同练习机械进修模子,而且一切的练习数据都保留在本来各自的装备上。假如这类算法被证明为是胜利的,那末也许在不远的未来,一切数据一切者就不再须要开放同享本身的数据,但却可以享遭到与开放数据雷同的优点。


第二项手艺是区块链。


我们晓得,区块链手艺有一项重要的特性,就是可追踪。假如将数据采纳区块链手艺举行加密,在其全部转移的进程当中,我们便可以清楚地看到它的去处,晓得它终究被谁运用过,又被谁复制过。有了如许的手艺前提,数据的供应者便可以对运用者在未经本身许可的状况下走漏数据的状况举行有用追责,关于清楚界定数据的产权也会大有助益。


本文来自民众号:经济观察报(ID:eeo-com-cn),作者:陈永伟

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

相关推荐