学术动态CURRENT AFFAIRS
学术动态 / 正文
人行基础数据综合管理与应用分析

  经过30多年的信息化发展,人民银行已经完成数据总行集中、海量积累的过程,而如何有效地管理和利用这些数据,适应金融科技发展和履职新要求,成为人民银行信息化建设新的重要课题。

  人民银行数据管理与应用的局限性

  (一)数据采集机构范围有限。人民银行主要与传统银行业进行网络系统对接,对证券、保险以及第三方支付机构、互联网金融公司不能有效监测,降低了金融业综合管理的效果。

  (二)存在大量的从金融机构人工反复采集数据的现象。目前通过业务系统采集的数据用途单一,只能为某个业务服务,而人民银行调研工作多,监测数据多、任务重,统计口径不尽相同,需要人工从金融机构反复采集数据,这不仅占用大量人员精力,而且采集数据存在口径各异、数出多门、数据质量不高的现象。

  (三)业务部门以及分支机构间共享数据不顺畅。以中国普惠金融指标体系(2016版)》的第一次指标统计为例,数据报送经历了自上而下部署,分支机构内任务分解,再自下而上汇总报送的过程。各业务部门间以及上下级之间数据没有实现自动化共享,需要各部门、各层级手工收集汇总。

  (四)数据深入分析运用不足。业务系统、统计系统提供业务办理、数据归集、查询等功能,而数据背后的分析工作主要依靠人工完成。核算数据、统计数据等各类数据在时间、空间、逻辑之间的关联性、趋势预测等深层次的数据利用不足。分支机构很难开展区域性数据分析。

  (五)数据统计类型单一。人民银行内部大量的wps、pdf、音视频等非结构化或半结构化数据没有得到有效应用。

  人民银行数据管理的策略

  (一)优化数据采集。将互联网金融公司、第三方支付机构以及银联、金融机构新兴业务系统数据平台尽快接入人民银行数据平台。利用技术手段减少人工采集的工作量,进一步实现数据采集自动化。逐步实施数字化监管协议,让监管政策和合规性要求实现“机器可读”。

  (二)建立统一的元数据管理。包括对元数据的组织以及相互间交互格式的规范定义,使从各业务系统抽取的数据,按照一定的标准、一致的方式和格式进行存储并交互,从而支持跨系统数据应用,实现全行统一的数据视图和共享。

  (三)分层次规划数据交换与整合规范。在ODS中建立源数据层、标准化数据层,分别提供从各业务系统抽取的当前细节的、完整的动态数据以及跨系统一致性数据,满足事务性操作人员和报表系统使用。在DW中建立基础数据层、汇总数据层、应用集市数据层,通过对ODS中数据的汇总整合,提供对于时间跨度比较长,跨系统的历时数据的分析应用,满足全局或某几个专业主题的管理人员分析决策需要。

  (四)搭建分布式大数据平台。人民银行数据平台要满足大容量、多格式以及高速度要求,拥有较高的扩展能力、故障容错能力和数据高可用保障机制。分布式架构在可用性、敏捷性和成本上的表现要优于主机集中式架构,且适应场景与人民银行的业务特点相吻合。Hadoop框架是目前流行的分布式数据平台实践。其核心设计是分布式文件系统HDFS和并行计算模型MapReduce,分别对应海量数据的存储和并行计算。

  (五)提升分析施策能力和服务水平。深入开展机器学习、数据挖掘等新技术研究,提高专业技术应用水平。同时,与掌握金融化科技要件公司开展合作,在人民银行内部成立相关业务领域研究小组,建立数据应用模拟环境与专业模型,为金融改革和监管需求提供系统支撑和技术工具。

责任编辑:hanhao34