我的位置: 深度 > 纵深 > 文章详情
跑起来的数据才是数据
分享至:
 (2)
 (1)
 收藏
来源:上观新闻 作者:柳森 2017-11-26 13:47
摘要:缺乏标准将阻碍数据开放

 

党的十九大报告指出,要加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合。事实上,环顾全球,一些国家、地区已在探索开放数据如何为城市治理增添动能的道路上迈开脚步。
   

在不久前举行的2017上海国际开放数据与城市创新峰会上,来自世界各地的多位开放数据专家和实务操作者们,带来自己所在城市、领域的成果与大家切磋交流。

 


单打独斗无法实现数据开放
Andrew Collinge
(大伦敦市政府助理总监)

   

谈到数据对于城市的重要性,大家有目共睹,伦敦也概莫能外。就伦敦而言,数据开放最核心的意义在于,通过创新的方式使数据为我们所用,帮助我们提升城市管理的能力和水平。
   

如何为未来打下基础,真正使伦敦踏上创新城市之旅?我们的策略是推出一些平台。通过这些平台的推出,形成整个伦敦市的数据架构。
   

从2012年开始,一方面,我们以合同外包方式购买服务,通过伦敦市开放数据门户(London  Datastore)这样的项目,把一些数据披露出来。另一方面,为使市民和公众更易获得数据,我们开发了“城市仪表盘”,以APP的方式提供实时交通、运输等数据。
   

发展到今天,伦敦市开放数据门户月均访问量达7万多次。24%的访问量来自个人,30%来自伦敦各级政府,30%来自于伦敦以外,9.2%的访问专门针对学术和教育。有了这样的公众参与基础,我们的数据质量得以稳固提高。数据不止供政府相关部门使用,也供公众使用。“城市仪表盘”共有1200个数据集,使伦敦市民在出行过程中能更好地从数据中受益。
   

为什么要开放这些数据,为什么希望人们进行访问?因为我们认为,数据收集不光是数据科学的问题,还是如何利用数据更好提供公共服务的问题。

 

从这个意义上来讲,可共同使用、可机读、可交互操作的数据,是21世纪政府的重要服务能力所在。只有真正可机读、可交互操作的数据,才能打破条块分割。只有有了文化和技术设施方面的障碍排除,才能协同增效,确保数据驱动和政策运营。
   

为此,我们曾花几个月的时间解决数据的可机读、可交互操作问题,还请来数据科学家共同协作。他们来自于不同部门,大部分来自于学术圈和一些咨询公司。尤其是后者的参与,帮助我们在数据安全、数据隐私问题上有更好的应对,也更好地解决开放数据可能引发的法律问题。这是非常重要的一个步骤。
   

实践告诉我们,政府不可能通过单打独斗实现数据开放。利用各方的力量来共同解决开放数据问题,是建设开放数据之城的必要举措。尤其对于伦敦这样的大型城市,要进入开放数据的未来,必须社会各方通力协作。
   

我们需要公开的API(编者注:应用程序编程接口),需要开源代码、云技术,需要可以分享的数据平台,还需要把这样的知识和经验跟其他城市进行交流。我们需要这些数据是安全的,在被需要的时候随时可提供,还希望探索出与物联网技术相结合的新数据源,并建立数据市场。
   

总而言之,我们希望通过开放数据,强化城市治理,也为我们的市民、为我们的社区、为我们的城市创造更多的价值。

 


数据不能只能看不能用
郑磊
(复旦大学数字与移动治理实验室主任、教授)

   

经常有人会问,数据开放和以前经常讲的政府信息公开有什么区别?

 

可以这么回答:如果说,信息公开更多是满足老百姓的知情权,从而可以更好地监督政府、参与政府事务,那么,开放数据更强调的是数据能够被利用和再次利用。换言之,数据开放不仅要让老百姓看到或者知道,还关乎数据能否被处理和开发,如何产生更多的应用,为城市带来价值。如何让数据得到利用和再利用,这和数据仅仅被看到是不一样的。
   

2012年5月,上海在全国率先开放数据。此后5年间,中国20多个省级、市级、区级地方政府陆续建立了自己的开放数据平台。为了更好增进社会各界对这项工作的认知,今年上半年以来,我们的研究团队发布了一份开放数据平台评估报告,用“开放树林指数”呈现中国各个城市在数据开放方面的表现。
   

我们为什么要给这个指标体系取名为“开放树林指数”?因为整个中国的开放数据就犹如一座巨大的森林,每一个被开放的数据源仿佛其中的一棵棵小树。整个中国开放数据森林能否蔚然成林,取决于每一棵树木能否茁壮生长。
   

如何建立数据开放的评估办法和评估标准?我们首先研究比对了国际上各种版本的数据开放准则。比如,联合国电子政务调查报告对开放数据就有一个定义:主动在网上公开政府信息,使任何人都能不受限制地获取、再利用和再分发。我国政府这两年也针对相关领域颁布了文件。
   

随后,我们邀请了二三十位国内高校相关领域的专家学者,请他们给刚才提到的各种指标打分,回答哪些指标在中国更重要;并找到真正想获得政府开放数据、要使用开放数据的企业和创业者,请他们说说自己的实际使用感受。
   

结果我们发现,尤其对于使用者而言,最重要的是数据的价值,最不重要的是数据的量。而原数据的质量、数据的格式、数据的背景知识、基本信息,能让人们更好地使用数据,也方便政府层面更好地从法律上授予使用者利用和再利用数据的权利。
   

对于大家认为更重要的指标,我们在打分时就赋予更高的权重:数据的格式,是否真正满足开放数据的标准,这最重要,占50%的权重;开放数据的总量,给它的权重并不是最高,占15%;数据的覆盖面,跨部门、跨主题、跨关键词的覆盖面,占15%;数据的更新,是否是最新数据,不断满足数据可持续性和延续性,占20%。
   

下面再有二级、三级指标,从更细节的角度看什么是开放授权、什么是技术性的开放。比如,在这个平台上,能否便捷地得到数据;有否为方便访客找到数据,提供一些导览、搜索工具;是否有互动反馈,让访客可以对平台提出数据请求,在发现数据有问题时可以将相关信息提供给平台。
   

随着我国各地开放数据本身的发展,我们还会再调整指标,让它像跳高的竿那样,至少让一些城市能够先跳过去。等大家都能跳过去了,某些具体指标的权重就会降低。排名不是主要目的,主要目的是,各地可以通过这个指标体系看到自己的现状、优化提升自己的具体操作。
   

也是通过这些指标的设计和具体评测,我们发现了全国各地在数据层的一些共通问题:比如,有些数据只能看到,而不能真正被利用。又如,平台上没有开放数据的相关协议,等于没有授予访客利用数据的权利。一旦有人用了之后,还会追责。再如,平台上的数据多年未作更新,或者所提供的数据按照政府视角而不是公众视角取名字。
   

这提醒我们,打通数据供给侧跟需求侧之间的壁垒,让大家能够互相沟通,是开放数据得到较好利用的必要前提。数据要想被看懂和被较好利用,数据提供者给予基础性的服务还是很有必要的。只有如此,数据从开放到利用之间的循环,才能被真正打通。

 


用数据助力经济活动
汤奇峰
(上海数据交易中心CEO)

   

所有对数据的利用都有个方向。作为上海数据交易中心,我们工作的出发点主要在于思考:利用数据开放和共享,可以为企业和经济活动带来怎样的着眼点?这些着眼点又将如何影响经济活动的走向?
   

从企业角度看,数据开放和共享会给它们带来哪些影响呢?这里面牵涉到的层面比较多,今天想利用这个机会讲讲其中最典型的两个层面。
   

一个层面是从基础层面来看,当一个企业为了刺激本身的发展,产生一个特定的应用诉求时,有没有数据可以被它使用?它所需要的数据在这个市场上有没有供应?如果有供应,这些供应者的效率如何?
   

我们研究了中国的战略数据资源分布,发现绝大部分数据都和政府的提供相关。比如,我国正在搞“双创”,“双创”过程中可能需要使用到的很多数据和工商部门相关,企业经营活动和税务相关,还有很多活动跟海关数据相关。我们的不少政府部门已经有相当完善的信息系统,但是在整个数据开放的进程中,各个部门开放的节奏并不同。这时,你的数据是不是可以根据市场上的具体需求提前开放?
   

第二个层面,每个部门、每个系统在组织数据资源时,往往都有一套自己的方法。这就会造成当一些企业需要使用数据时,必须针对每个不同的归口、条线去做接洽。这在一定程度上会影响数据使用的效率。这方面的效率,有没有办法提升?
   

最近,上海市政府在数据共享开放方面做了很多地方性规范工作,有关于规章制度的,有关于数据开放标准接口的,正是在提升数据普遍适用性方面非常有意识的调整。从这个角度讲,企业利用开放数据为经济活动服务,是非常明确的路径。
   

为此,我们现在还有一项主要工作就是帮助企业搭建数据应用可以依凭的网络。让企业可以很容易就知道,它们想要的数据在哪儿,如何方便地使用数据,在使用数据后又怎样对已经使用的数据做一个反馈和评估。我们相信,通过这样的工作,可以有力推进整个企业界在一个更开放的数据环境中使用数据,从而又使相关经济活动产生更好的效益。

 


缺乏标准将阻碍数据开放
何杰
(中电科大数据研究院有限公司总经理)

   

目前,国家层面已经出台了一些促进大数据领域发展的行动纲要。从我们的前期研究来看,大数据开放是这个领域能否获得长足发展的关键。但从实际操作与应用来看,我们自己感到,还有一些地方需要提升———
   

第一,目前缺乏一个全国性的数据开放的标准。以上海、贵阳、广东为例,大家都针对数据的编目、加工、共享、开放,在标准的建立上有很多很好的尝试。但问题是,这些标准之间并不统一。站到全国层面去看,这种不统一甚至在一定程度上阻碍了数据开放。
   

第二,地区之间在数据的治理理念上有差异。上海、北京、广东这些经济比较发达的城市走在前列。但看中西部,由于基础不同,一些城市对这个问题的理解还有待加强。
   

第三,数据在共享开放方面缺少一个有效机制。我们在与各级政府、各个城市的沟通中感到,部门之间还存在一些数据共享开放上的壁垒。诚然,这方面较以往已经取得很大进展,但在沟通和合作机制上还是比较缺失。
   

第四,数据的安全保障问题。现在一些政府出于对开放数据带来不安全因素的担心,在数据开放上始终是“最小级”,或者提供的数据可用度不高。要改进这方面,我们认为,对策是设计一个有效的审核数据安全性的保障机制,并将这种保障机制与具体应用场景紧密结合。这样就可以让政府层面在数据安全有保证的情况下,更放心地把数据开放出来,供全社会使用。
   

第五,一些政府和地区对数据的分级分类有一些思考,但体系不完整。
   

今天论坛上有多位专家讲到,标准是数据开放的根本基础。只有把标准在一定程度上统一和衔接起来,数据开放这件事才能“跑”起来,数据才能活起来。对此,我们也深以为然。我们希望能在这方面做一些工作,让政府各部门和企业了解自己的数据可以怎么用,具体到各个场景中,又可以怎么用。

文字编辑:龚丹韵 图片编辑:笪曦
上一篇: 没有了
下一篇: 没有了
  相关文章
评论(1)
我也说两句
×
发表
最新评论
快来抢沙发吧~ 加载更多… 已显示全部内容
上海辟谣平台
上海2021年第46届世界技能大赛
上海市政府服务企业官方平台
上海对口援疆20年
举报中心
网上有害信息举报专区
关注我们
客户端下载