联系方式:010-59919125
当前位置:首页 > 政务理论

我国政府开放数据门户网站绩效分析

日期: 2018-07-02

1、引言

  数据作为政府治理国家的重要依据, 已经成为政府拥有的核心资产。在世界范围内, 建立政府开放数据门户网站的已有45个国家、163个地区。近年来, 为创造一个更加高效、透明、富有责任感的政府, 我国许多地区也陆续通过建设门户网站的方式推动当地数据开放共享, 方便公众及时、准确的获取数据资源。因此, 随着web2.0等互联网应用为代表的大数据时代的来临, 数据开放变成一种趋势, 重视政府开放数据门户网站建设、提高门户网站设计、运营和管理水平, 已经成为一项重要课题。

  自2009年美国开放数据门户网站Data.gov正式上线以来, 全球迅速掀起开放数据运动, 美国、英国等发达国家在开放数据领域已相对成熟。根据公共管理理论思想中提到的“不可衡量, 则无法管理”, 想要对我国政府开放数据门户网站进行有效管理, 就必须对其绩效进行分析, 从而提高政府开放数据的利用率, 为公众提供更高质量的数据和服务。

  国内在现阶段对该领域的研究不足可以概括为以下两个方面。一方面, 国内学者主要强调政府开放数据的重要性和必要性, 而关于开放数据开发利用与开放数据安全等领域的研究相对不足, 政府开放数据门户网站的建置仍需进一步提升, 数据的种类、数量、质量和时效性仍需进一步加强。另一方面, 虽然国内已有学者对政府门户网站进行评估, 但评估框架大多强调“基础”和“数据”层, 忽略了“平台”层与数据使用的评估, 缺少一套具有针对性和系统性的绩效分析框架。

  综上所述, 本文将从用户角度出发, 根据我国政府开放数据门户网站建设的实际情况, 并结合国外相关组织评估框架构建的先进经验, 试图从“平台”、“数据”和“使用”三个维度对我国政府开放数据门户网站绩效进行分析, 并提出相应对策, 以期对相关领域的研究有所帮助。

  2、研究框架与方法

  2.1 评估框架

  万维网基金会组织开展的“开放数据晴雨表”是经各国政府和国际组织广泛认可的政府开放数据评估项目。“开放数据晴雨表”从准备度 (35%) 、执行度 (35%) 和影响力 (30%) 三大方面对不同国家和地区的开放数据进行分析, 以分析全球开放数据发展趋势。万维网基金会组织和纽约大学治理实验室根据现有的开放数据评估体系总结出一套通用评价框架 (见图1) , 包括四个维度。

640.webp.jpg

图1 开放数据的通用评估框架

  英国开放知识基金组织开展的“全球开放数据指数”被许多国家政府采用作为评价开放数据项目绩效的关键绩效指标, “全球开放数据指数”对各国政府是否开放10个关键性数据集进行分析, 例如国家统计数据、政府财政预算、选举结果等, 并侧重评价其技术和法律的开放性。同时, 每个数据集细化到具体的数据指标, 并通过一系列评估标准 (例如数据格式、数据机读性等) 赋予权重, 最后加权平均算出每个国家的得分。

  笔者通过梳理“开放数据晴雨表”和“全球开放数据指数”两项开放数据国际评估项目发现, 两项评估项目都侧重于国家层面, 尚不能对我国地方政府层面的开放数据进行全面系统地分析。本文从用户角度出发, 根据我国开放数据门户网站建置现状, 基于通用评估框架并归纳整理郑磊、关文雯在《开放政府数据评估框架、指标与方法研究》一文中梳理的核心指标, 构建了“平台”、“数据”、“使用”3个一级指标、16个二级指标的评估框架, 并采用德尔菲法确定一、二级指标权重, 即通过匿名统计的方式收集专家意见, 对专家提交的结果进行整理、分析、总结、归纳, 经过多次反复最终确定一、二级指标权重。三级指标权重的设置参考“开放数据晴雨表”, 即平均分配三级指标权重, 其核心指标体系见表1。

表1 我国政府开放数据门户网站绩效分析指标体系

640.webp (1).jpg

  2.2 打分方法

  本文引入基准值法、标杆法、功效系数法等多种绩效打分方法对指标打分, 防止主观评价造成结果有失偏颇, 使评价结果更为科学地转化为绩效分数。

  (1) 有无测试法:指标判定为“有”时, 该指标得满分;指标判定为“无”时, 该指标不得分。

  (2) 基准线法:对指标设立基准线, 若相应指标超过基准线则得满分, 未超过基准线时使用以下计算公式:

  该指标得分= (指标值/基准值) *满分 (保留小数点后两位)

  (3) 标杆法:将指标中数量最多的最优值设为标杆, 得分计算公式如下:

  该指标得分= (指标值/标杆值) *满分 (保留小数点后两位)

  (4) 功效系数法:

  ①设置五档标准值。各项指标的评价档次分别为优 (A) 、良 (B) 、中 (C) 、低 (D) 、差 (E) 五档。

  ②对五档标准值分别给定五个标准系数:1、0.8、0.6、0.4、0.2。

  ③按以下方法对每个指标计分:

  上档基础分=总分×上档标准系数;

  本档基础分=总分×本档标准系数;

  标准值确定方法:本文采用分段简单平均法测算标准值。

  具体步骤为:对样本指标按实际值进行排序, 并平均分成5层。前20%的样本为第一档, 20%~40%的样本为第二档, 40%~60%的样本为第三档, 60%~80%的样本为第四档, 80%~100%的样本为第五档, 该五档样本的简单平均数记为本档的标准值。

640.webp (2).jpg

  ④总得分=∑单项指标得分。

  2.3 样本选择

  除特大型城市北京、上海之外, 目前, 我国地方政府开放数据门户网站开始扩展到不同地域、不同规模。笔者从媒体、官方报道并通过搜索引擎以“数据+gov.cn”和“data+gov.cn”为关键词查询了解到20个正式上线的开放数据门户网站, 充分考虑地区的差异性、网站建设的成熟度和行政级别的多样性, 进行样本选择。剔除不支持数据下载、网站建设差距较大的厦门市海沧区、深圳市罗湖区、深圳市福田区和处于“试运行”阶段的哈尔滨市、长沙市、广州市, 最终确定14个样本对象 (见表2) 。

表2 开放数据门户网站绩效评估的样本对象

640.webp (3).jpg

  3、绩效评估结果分析

  3.1 平台层

  随着越来越多开放数据门户网站的正式上线, 用户对平台的体验要求也越来越高, 对“平台”层建设进行分析至关重要。

  (1) 界面体验。人性化的界面体验、首页的响应时间决定用户访问频率和体验效果 (见表3) 。

表3“界面体验”指标分析一览表

640.webp (4).jpg

  美国研究生项目资讯网站的调查结果表明, 网页加载时间超过4秒, 约有1/4的人会放弃打开该网页。本文使用站长工具 (http://tool.chinaz.com/) 中的“国内网站测速对比”作为测速的依据, 该工具使用全国各地数十个服务器对目标网站的首页响应时间进行测试, 并得出最快值、最慢值和平均值。考虑到全国各地用户的使用体验, 本文使用最慢值作为评判标准。通过移动适配工具 (shipei.chinaz.com) 对网站进行移动适配性测试, 从结果来看, 大多数网站“不适合”在移动设备浏览, 其中贵州是因为“内容长度超过了屏幕宽度”, 其余网站均为“未设置移动设备自适应标签, 网页等比例缩小时文字太小, 不适合阅读”, 浙江省公共数据开放目录右侧栏目中提供移动端APP下载和微信关注, 青岛政府开放数据网站提供手机版网页切换, 可手动点击切换至青岛政务网无线门户 (m.qingdao.gov.cn) , 便于移动端用户访问、下载数据。

  (2) 数据展现。生动的数据展现可以让用户方便、快捷的看懂数据, 并有效的利用数据, 该指标是评估框架的重要组成部分 (见表4) 。

表4“数据展现”指标分析一览表

640.webp (5).jpg

  青岛专门设有网站统计栏目, 详细统计了总访问量、月访问量前十、评分前十等诸多信息, 上海和贵阳仅提供网站访问量, 其余地方未开设网站统计功能。

  (3) 数据导引。该功能可以帮助用户迅速查询到所需数据, 是网站建设中的重要组成部分, 也是网站绩效评估的重点 (见表5) 。

表5“数据导引”指标分析一览表

640.webp (6).jpg

  调查发现, 仅北京、广东、贵州、青岛、贵阳和海曙六个地方列明了平台数据总量, 其余地方只列明了每个数据领域下的数据总量。大部分网站提供按主题和按机构两种类型分类导航, 其中无锡只按机构分类, 贵州和海曙只按主题分类。

  (4) 数据获取。方便的数据获取途径可以为用户下载使用数据时节省更多的时间, 同时提高数据的使用率。浙江、广东、无锡、湛江和坪山的数据获取流程最为便捷, 均无需注册即可下载;深圳、武汉和青岛无需实名注册即可下载, 其中青岛支持使用其他账号登陆下载数据, 如微信、微博、QQ等;北京、上海、贵州、贵阳、南海和海曙需实名注册后才能下载, 其中北京和上海不仅需要真实姓名还需提供用户身份证号码才能完成注册, 海曙的数据获取则分为对注册用户开放与对企业团体开放。

  (5) 数据应用展示。将网站提供的数据应用下载到手机客户端可以随时随地监控所需数据, 为用户的日常生活提供了极大的便利。北京、上海、浙江、广东、贵州、深圳、青岛、武汉、无锡、贵阳、海曙均设有数据应用展示;北京、广东、武汉、无锡、青岛、海曙、南海均支持开发者提交APP应用, 其中海曙区设定通过审核的企业用户才可以提交APP应用。

  (6) 互动交流。用户对网站及数据的使用情况进行反馈, 可以有效地为网站建设和数据开放提供参考, 进一步促进政府按需开放数据 (见表6) 。

表6“互动交流”指标分析一览表

640.webp (7).jpg

  其中, 部分地方虽已开设数据集评价功能, 但实际利用率并不高, 评价区的评论寥寥无几。关于网站维护单位及联系方式的设置大部分地区并不全面, 例如武汉市只给出单位邮编。

  3.2 数据层

  对“数据”层的评估一直是一项评估重点。本文从6个二级指标对开放数据的“量”和“质”进行系统分析。

  (1) 数据量分析。开放数据应提供可机读格式 (例如XLS而非PDF) , 并且可以正常下载。基于此要求, 通过人工观察记录的方式对数据进行抓取, 且所有数据均来自公开渠道。截止到2017年3月20日, 各地方网站数据开放总量与可机读数量对比如数图据开2放所总量示与。可机读数量对比

640.webp (8).jpg

图2 数据开放总量与可机读数量对比

  由上图可清楚地看出, 开放数据总量最多的是武汉, 最少的是坪山, 且各地开放数据总量相差悬殊。各地区中发布可机读数据最多的是上海, 最少的是浙江, 目前仅北京、广东、青岛、贵阳、坪山和海曙六个地区100%提供可机读数据。

  (2) 数据时效性分析。时效性是大数据可用性的重要指标, 开放数据会随着时间的推移逐渐贬值, 只有数据集合中的每个数据在合理或规定的周期内更新, 才能确保其使用效能。本模块对各地区网站的更新频率进行了调查研究并分类统计 (深圳、武汉、无锡、坪山、南海未承诺更新时间, 浙江大部分数据未承诺更新时间) 发现, 目前开放数据网站中静态数据 (更新周期为每年或按需更新) 平均占69.7%, 动态数据 (更新周期为一年以下) 平均占30.3%。其中, 海曙区网站数据均属于动态数据, 湛江市均属于静态数据 (见图3) 。

640.webp (9).jpg

图3 开放数据更新频率分布

  在承诺了更新频率后, 是否能按照承诺更新也是保证时效性非常重要的一部分。采集过程中, 根据最近一次更新距现在的时间是否小于承诺的更新周期来判断是否按承诺更新。经分析, 贵州按承诺更新完成的比较好, 有97%的数据均按时限更新, 贵阳和广东分别有81.5%、68.6%的数据按承诺更新, 而其他地方平均仅有37.3%的数据能各够地按区时数更新据 (按见承图4诺) 。

640.webp (10).jpg

图4 各地区数据按承诺更新数量

  (3) 数据格式分析。开放数据所采用的格式应当是开放格式。开放格式指的是任一数据文件不需要任何指定或付费的应用程序即可进行访问, 由开放透明的过程定义数据格式标准并且不限制任何人实现其标准, CSV是常见的开放格式。根据Berners-Lee的五星评价方法, 并结合国内开放数据格式现状, 使用三级评价模式 (评分时, 一级不得分, 二级得2分, 三级得4分) 。表7为各地区政府门户网站开放数据采用的格式。

  一级:网站向用户提供数据下载, 但不支持机器读取。如:JPG、PDF等。

  二级:网站向用户提供结构化数据下载, 数据支持机器读取, 但需要指定软件打开。如:XLS、XLSX等。

  三级:网站向用户提供开放格式数据下载, 数据支持机器读取且不依赖指定软件。如:CSV、XML等。

表7 开放数据格式一览表

640.webp (11).jpg

  经调查发现, 只有北京100%提供了开放格式, 上海、贵州、贵阳和南海部分数据提供开放格式, 其他地区并没有采用开放格式。

表8 开放数据格式表

640.webp (12).jpg

  从表8可以看出, 各种数据格式均有其优缺点。因此网站支持多种格式数据下载更能满足用户的各项需求。上海和南海在发布数据时提供了多种格式, 这样可以更加方便快捷地满足不同需求的数据使用者对数据的增值利用。

  (4) 元数据分析。元数据是指描述数据的数据, 即对数据和信息资源的描述性信息。Data.gov提供的元数据分类已达18种。各地区在提供数据的元数据时所采用的标准不尽相同。目前, 各地区都能提供基本的元数据信息, 包括数据名称、发布单位、数据分类和数据描述等。本文重点从以下两项关键日期信息对各地区网站进行考察: ①数据的发布时间; ② 数据的更新时间。

  调查结果为:①数据的发布时间:深圳、贵州、青岛、武汉部分数据、无锡和海曙未能清楚的标记出数据的发布时间, 只能通过网站提供的历史数据进行推算; ② 数据的更新时间:上海、浙江、深圳、武汉、贵阳、南海和坪山将数据的更新时间明确标记在数据页面上, 北京、广东、湛江、海曙、青岛和贵州都把此信息提供在数据目录中, 而不是数据页面上, 不方便用户查找该信息, 无锡尚未提供该元数据。

  (5) 数据的开放授权分析。开放数据的开放授权也是分析网站数据的另一重要维度。授权条款通常在开放数据门户网站的免责声明中说明, 经考察发现, 北京、上海、浙江、广东、青岛、武汉、无锡、贵阳和南海9个地方对数据予以了授权, 其中只有无锡确保了所提供的数据全部可供下载并将永久免费, 而其他地区对数据的免费性仅提供一个相对模糊的时间期限。各地区的数据授权协议均未能对用户的自由使用权、传播分享权给予清晰明确的保障, 甚至有些地区存在与开放授权要求不符的条款。

  (6) API接口。北京全部数据均支持API接口, 且提供了接口调用次数, 可自由调用;上海、浙江、贵州、深圳、青岛、贵阳和海曙部分数据提供接口, 其中青岛使用接口需要申请。广东、武汉数据虽不提供API接口, 但网站提供基于地理空间信息服务的接口, 可用于基于地理信息服务的应用。无锡、湛江、坪山和南海不提供API接口。

  3.3 使用层

  “使用”层的分析是从用户角度考虑, 以衡量用户使用情况为目标, 评价网站数据是否实用。

  (1) 平台访问量。平台访问量采用第三方网站 (站长之家) 的百度权重查询工具进行统计, 该工具可计算通过百度搜索引擎访问网站的预估流量。CNNIC (中国互联网信息中心) 在2016年7月26日发布了《2015年中国网民搜索行为调查报告》, 报告中指出百度搜索的常用率达84.3% (360搜索11.9%, 搜狗搜索1.7%, 其他2.1%) 。因此, 通过百度搜索引擎统计出的预估流量具有一定的代表性。本文在2016年10月~2017年3月, 每周一晚8点统计当日访问量, 最后得出每日访问量平均值 (见表9) 。

表9 平均访问量一览表

640.webp (13).jpg

  从统计结果来看, 上海的访问量明显高于其他网站, 可以看出上海对于开放数据网站的建设与推广做了大量工作, 用户活跃度较高。

  (2) 数据集下载量。数据集下载量可以体现用户的关注热点和数据的使用情况。由于各网站中数据集总数量具有较大差异, 单纯比较数据集总下载量不能科学判断各网站数据下载情况, 所以选用数据集平均下载量 (见表10) 。在数据采集过程中, 采用人工采集+电脑计算的方式进行。

表10 数据集平均下载量一览表

640.webp (14).jpg

  从统计结果来看, 上海数据集平均下载量 (1099.8) 明显高于其他网站, 说明上海开放数据的可用程度很高, 深受用户欢迎。与之形成对比的是武汉, 开放数据集数量 (1 860) 居所有网站之首, 但平均下载量仅为2.8, 说明武汉在保证数据开放程度的同时, 需要甄选优秀数据, 提高用户搜索、使用开放数据的效率。

  (3) APP访问量。对APP应用的统计是对政府开放数据使用统计的一个最直接、最有效的途径, 而APP访问量也直接体现出用户对于开放数据应用的需求。各门户网站的移动应用总量存在差异, 为避免应用数量对预览量的比较造成影响, 使用APP平均访问量进行比较 (见表11) 。

表11 APP平均访问量一览表

640.webp (15).jpg

  从APP的访问量可以体现出网站展示APP的质量情况, 北京市开放的APP虽然数量不多, 但是访问量均达到20000以上, 明显高于其他网站, 而且其所用的数据均是开放数据门户网站所提供的, 有利于数据的二次利用。同时从其主要应用类型来看, 主要侧重于交通、健康、生活等民生方面。

  (4) 媒体推广度。媒体关于开放数据的新闻报道量可以检验政府开放数据使用效果, 并体现当地政府对于政府开放数据网站的推广力度。本文使用百度新闻 (http://news.baidu.com/) 新闻搜索功能, 以“XX (地名) +政府开放数据网站”为关键词, 对新闻全文进行搜索 (见表12) 。

表12 新闻报道量一览表

640.webp (16).jpg

  从统计结果来看, 贵阳新闻报道量最高, 北京、上海、青岛、贵州作为一线城市或省级网站, 新闻报道量也明显高于其他网站。说明媒体对这些网站的曝光率、关注度比较高, 当地政府对开放数据网站的建设比较重视, 这有利于政府开放数据网站的普及、推广, 更利于企业和用户后续的使用。

  3.4 综合得分

  “平台”层各指标均采用有无测试法进行打分, 根据上文中的分析, √得满分、☆得半分、×不得分。“数据”层各指标采用多种打分方法。由于各地方网站开放的数据总量差距较大, 故对数据量评估时采用基准线法, 并根据实际情况设定数据开放总量1 000为基准值。动态数据和按承诺更新数据量评估采用标杆法, 以占100%作为基准值。数据格式数量采用标杆法, 取数量最大值为标杆值。元数据、数据的开放授权和API接口的评估采用有无测试法, 并依照各评估细则实际分析结果给予满分、半分、零分的分值。“使用”层各指标均采用功效系数法进行打分。网站总体得分及排名情况见表13。

表13 网站总体得分及排名情况

640.webp (17).jpg

  经计算, 14个样本网站的平均分数为52.56分, 超过60分的仅有4家网站, 占总数的28.6%;超过50分的有8家网站, 占总数的57.1%。第一名 (上海市, 74.01分) 与最后一名 (坪山区, 34.91分) 得分相差悬殊。3个省级城市网站中, 广东省处于领先位置;3个市辖区网站中, 佛山市南海区总排名比较靠前;但二三线城市的门户网站建设水平较差。贵州网站作为省级网站, 政府虽给予了足够的重视, 但建设现状仍不尽如人意。同时, 即使是处于领先地位的北京、上海、青岛等城市, 其网站建设和开放数据质量水平距美国、英国等数据开放“先驱者”还有很大的差距。

  根据表13网站总体得分及排名情况, 笔者利用Photoshop和Microsoft Visio两个绘图工具绘制出我国14个政府开放数据门户网站绩效评估结果的地域分布图, 如图5所示:

640.webp (18).jpg

图5 评估结果地域分布图

  从图中可以明显看出我国发展较好的政府开放数据网站主要集中在一线及沿海城市。城市的经济实力在一定程度上决定政府开放数据网站的前期投入, 沿海城市的经济投入越大, 网站的建设水平、数据的开放质量越好。当网站吸引足够的用户后, 用户会根据使用情况对网站进行反馈, 从而改善网站的运行质量, 产生正激励的作用。反之, 对网站的经济投入较小, 网站建设欠佳, 用户的“二次访问率”不高, 未形成良好的互动效果, 政府开放的热情变小, 从而影响数据开放效果。

  4、对策建议

  4.1 平台建设

  平台建设方面, 完善政府门户网站服务功能, 编制并张贴用户操作指南、政府开放数据服务指南等参考信息, 为群众查找利用政府开放数据时提供便利, 帮助群众快速查找到有价值的数据。加强线上交互平台建设, 为政府与公众间交流提供渠道;建立完善的站内搜索功能, 用户可根据不同需求通过多种途径 (如来源部门、更新时间、下载量、主题等) 对平台数据集进行检索;提升政府门户网站的兼容性和可扩展性, 使用户获取开放数据更加便捷和高效, 为政府开放数据的良性发展提供有力保障。

  4.2 数据建设

  数据建设方面, 提高政府门户网站开放数据质量, 积极主动且及时开放政府数据, 尤其是与民众、国家社会体制和经济发展状况息息相关的, 迫切需要政府开放的数据, 例如教育、医疗、就业、公共安全、食品药品等方面的数据;增加数据集数量, 丰富数据格式;提高开放数据信息技术方面的服务, 如元数据的设定和网络应用程序编程接口 (API) 的开发利用等;加强开放数据的更新与维护;加大开放数据安全与隐私保护, 职能部门在开放数据时, 有责任对数据进行有效地甄别, 明确责任机制和责任人, 避免数据开放造成侵犯隐私。

  4.3 体验建设

  体验建设方面, 提供完备的用户个性化参与机制, 政府可以把社交网站中用户个性化参与机制融入到开放数据门户网站中, 建立网络社区, 用户可以根据需要管理自己的数据;提供社交网络账号 (如微信、微博、QQ等) 注册登录功能, 将政府开放数据门户网站融入到用户社交网络中, 实时推送更新数据;加强数据应用展示, 激励数据应用开发;加强政府数据开放工作的宣传工作, 鼓励公众善于运用政府免费主动开放的各类数据, 提高政府数据的利用率。

  5、结语

  大数据时代, 构建政府开放数据门户网站, 提高政府透明度, 是政府的新使命。目前, 我国政府开放数据门户网站的建置尚不完善, 数据开放的数量、质量和时效性等还需提高, 公众对数据开放不够了解, 企业、个人对开放数据的应用不够多, 地区之间的发展存在不平衡现象。政府数据开放工作任重而道远, 我国政府在建设开放数据门户网站时必须要有担当精神、服务意识和惠民意识, 努力做到服务对象细化、网站栏目设置精选、开放数据海量、并且服务及时到位, 更加表现出全心全意服务于公众。

 

责任编辑:杜凡


政务理论

我国政府开放数据门户网站绩效分析

发布时间:2018-07-02