阿里云刘伟光:金融行业全域数据“观”

Connor 比特币交易平台 2023-03-03 130 0

阿里云刘伟光:金融行业全域数据“观”

作者简介

刘伟光,阿里巴巴集团副总裁、阿里云智能新金融&互联网事业部总经理,毕业于清华大学电子工程系。加入阿里云之前,在蚂蚁金服负责金融科技的商业推广和生态建设工作以及蚂蚁区块链的商业拓展工作;在企业软件市场深耕多年,曾经创建Pivotal软件大中华区分公司,开创了企业级大数据以及企业级云计算PaaS平台的市场先河。在创建Pivotal中国软件公司之前,刘伟光曾经担任EMC大中国区数据计算事业部总经理,并在甲骨文中国公司工作多年,曾经创建了Exadata大中国区的产品事业部并担任事业部总监。

文章|《中国金融》媒体融合供稿

“大风起于青萍之末,浪成于微澜之间。”用这句话来形容中国金融行业数据领域发展的历程再恰当不过了。从2003年银行的数据仓库初建开始到今天整整20年过去了,相比其他行业,金融行业是真正完整地经历了数据仓库建设和大数据建设的两个十年周期。20年来,金融数据治理先后经历了从MPP技术到Hadoop大数据开源技术、从存储计算分离的云原生数据处理技术再到AI数据智能化的迭代转型,如今终于迈入了全域数据资产管理的数据中台化架构时代。在持续了20年的数据治理进程中,关于金融行业的数据计算分析和智能化运营的探索从来没有停止过,如何在原有的数据基础和平台技术积累上完成全局视角的数据能力提升和技术体系的迭代,正成为当下金融行业共同关注的话题,也是金融机构进入数字化智能时代的重要标志。

阿里云历时5年助力阿里巴巴集团完成了全域数据中台的建设,同时也在数据平台的建设和数据治理方面服务了众多不同类型的金融行业客户。数据智能化方面,在接触了近千家金融机构并了解其实际业务需求和现状后,阿里云加大研发和创新力度,从更全面、更立体的视角去定义数据的技术和业务价值,站在全局的高度去剖析数据生命周期的管理,利用云原生技术去帮助金融业进行数据计算能力的未来布局。本文结合阿里云多年的技术积累和金融行业数字化转型的需求,将勾勒从底层数据计算到数据资产化的完整路径,解析当前数据平台如何从分而治之的建设模式和技术体系逐步演进到具有全局视野的数据智能化中台。关于数据领域研究,不仅仅是技术命题,我们也会讨论金融机构内部数据运营模式以及数据人才建设体系这些当前重要话题。针对当前金融业数据领域的诸多痛点,我们将从数据的能力体系的建设方法、目标设定、成功标准,技术路线演进路径、数据运营机制等角度展开分析,旨在为金融机构的数据治理与应用提供新的价值发现和方法交流,共同推动金融行业实现数据驱动业务高质量发展的终极目标。

展开全文

金融行业数据领域面临的困扰

数字化程度的一个重要标志是“数据与业务的关系”是否能从“跟随”(事后分析),到“伴随”(实时分析),再到“引领”(智能服务)。经过20年的数据建设,我国金融机构的数据治理和应用有了显著提高,但机构之间的差异正在日益扩大,不同技术体系构建的数据平台分而治之,“数据底数摸不清、数据质量差、数据不好找、数据用不好、查询响应慢”等问题依然比较突出(见图1)。

图1 金融行业数据领域面临的困扰

阿里云刘伟光:金融行业全域数据“观”

一是数据平台跟不上业务发展步伐。从2017年到2021年,全国数据生产量增长了3倍多,实时数据、触点数据、过程数据、IOT数据、音视频数据等数据价值不断被深入挖掘,未来业务对数据规模、数据时效、数据类型、数据应用需求会进一步放大。现有的数据架构迭代滞后,面临“掉队”的情况。

二是数据管理普遍存在“数据有标准、没有落地”“指标同义不同名、同名不同义”“数据处理与元数据两张皮”等现象。以监管报送为例,每年超千万罚单均与数据质量相关,提高数据质量已成为亟待解决的问题。

三是数据资产“缺盘点”。金融机构大都面临着“指标多、资产少”的困境:报表很多,但能够服务业务且可复制、可重用的数据资产却很少。

四是数据服务效率低。目前大量金融机构“用数取数”还是传统模式,从需求到拿到数据需要数月时间,“响应慢”是用数部门普遍面临的痛点。

金融数据发展瓶颈的破题之术

在数字经济时代,未来的金融机构都是“数据驱动型”企业。金融服务日趋多元化、个性化、精细化,数据价值也从原来的“结果记录”发展为起到“实时精准制导”的作用。我们认为,数据能力像“水”,数据体系就像盛水的“木桶”。为了提升金融机构的整体数据能力,我们需要从顶层设计、业务价值、数据服务、数据治理、数智算力、数字人才六个维度提出“企业数据能力建设参考模型”(见图2)。

图2 企业数据能力建设参考模型

阿里云刘伟光:金融行业全域数据“观”

首先,数据体系的建设需要从原来单点需求功能实现转变为自顶向下的总体规划设计,审视构建满足业务战略的数据能力,将“数据+业务+技术+组织”融为一体,彼此联动,系统化建设企业级数据体系,全面提升数据能力。

其次,在业务目标上,让数据回归解决业务痛点的本源,将“以人为驱动”的业务经验总结出来,形成“以数据为驱动”的业务动作;在数据服务上,通过一站式数据门户,转变用数习惯,从按需申请转换到交互式自助模式,让数据使用更贴近业务;在数据质量上,要更加重视数据生产源头的治理,将数据标准有效嵌入从数据生产到数据消费的各个环节,打造全链路治理能力;在平台算力上,面对爆发式增长的海量近实时化数据以及数字化转型过程中敏捷的智能决策需求,金融机构数据平台架构迫切需要向云原生化和多算力融合能力升级。

最后,要加强数字化人才体系建设,数据产品经理应成为企业数据领域洞察业务需求、沉淀数据产品、提升服务供给能力的“破局者”。

金融数据能力建设的核心观点

数据战略就是企业战略。数据是一面“镜子”,如何把数据的价值从“后视镜”(做历史分析),转变为“望远镜”(看方向)、“放大镜”(精细化操作)、“显微镜”(发现问题真相),关键是看企业的数据体系的完整度(木桶的短板)和数据能力的应用程度(水位的高低)。

全局视角下的数据驱动力

站在全局视角,我们提出了全域数据观的“一张蓝图、3+1数据体系、6大核心能力”的数据能力体系框架(见图3)。

图3 全局视角下的数据能力体系框架

阿里云刘伟光:金融行业全域数据“观”

一张蓝图:通过自顶向下的设计方法,统一规划和设计数据驱动业务发展的战略目标和价值,推动企业整体数字化经营,从而系统化解决原有数据体系分散建设的问题。

三个驱动:采用存算分离、多引擎算力融合架构的算力驱动,打造企业级数字基建;构建以数据为驱动的“采建管用”的全域数据体系和“盘评治享”的全链路治理体系,沉淀企业高价值数字资产;运用“人货场”数字化运营体系的价值驱动,助力数业融合的数字应用。

一套机制:构建包含工作目标管理、组织架构支撑及数字人才体系等内容的一系列运营保障机制。

六项能力:通过“3+1”(3个驱动+1套机制)数据体系的建设,帮助金融机构在增效率、降成本、提质量、敏创新、强团队、建生态六项核心能力上得以提升。

分层视角下的数据核心能力

在数据能力体系中,“3+1”数据体系是核心能力,采用分层架构详细设计了数字基建、数字资产和数字应用三层核心架构,以及运营保障机制(见图4)。

图4 分层视角下的数据核心能力

阿里云刘伟光:金融行业全域数据“观”

1.数字基建五大法则

数字基建是数据计算和存储的算力基础设施。针对当前海量数据算不动、效率低、成本高、难运维等问题,新一代大数据平台建设通常遵循五大法则,分别是具备云原生扩展的多种计算模式融合、支持多层智能化的分布式存储层、统一调度和弹性伸缩的资源池管理、异构计算引擎的工作负载协同和大数据SRE智能运维能力。

2.数字资产

数字资产通过全域数据资产建设、智能化数据分析手段以及多样数据服务能力,实现企业数据的管理闭环,并打通各层级与多业务间的数据壁垒,实现数据的统一整合与运营,提高企业数据建设和应用的效率。在全域数据观的视角下,我们提出数字资产建设 4项核心能力+4项扩展能力(见图5)。

图5 数字资产建设4项核心能力+4项扩展能力

阿里云刘伟光:金融行业全域数据“观”

(1)4项核心能力,即通过“采、建、管、用”建设数据资产体系的能力。

所谓“采”,是指企业数据资产全域采集,核心能力在于“全域和时效”。全域是解决数据完整性问题,时效是解决数据实时性问题,同时多样数据源为了确保与企业内部数据融合,还需要规范化和标准化的管理机制保障。随着经营管理决策对数据时效性的需求,对数据全面性、实时性也提出了较高要求,如基于埋点数据的采集和分析可大幅提升客户经营决策能力。所谓“建”,是指敏捷构建企业级核心数据资产,核心能力在于“敏捷和复用”。敏捷解决的是数据模型研发效率低的问题,复用解决的是公共层、萃取层建设的数据资产共享问题。我们在进行数据模型分层体系、数据公共层模型体系、企业级指标和标签体系建设的同时,引入模式设计即开发工具提升数据研发效率和质量,并通过指标和标签体系沉淀企业高价值数据资产,引入数据连接(数据+算法+服务)技术实现多端设备互联互通,打通数据资产与业务通道,实现数业深度融合。所谓“管”,是指打造精品数据资产管理及运营体系,核心能力在于管好资产。数据资产管理是金融机构一直不断持续优化的能力,构建全域资产知识图谱,摸清家底;通过资产价值健康度评估,提升资源利用效能;借助源系统数据研发工具与数据治理平台工具集成,实现全链路数据治理体系升级,实现高价值数据资产的“金融活水”作用。所谓“用”,是指打通数据产品应用的“最后一公里”,核心能力在于价值和体验。数据产品和服务建设目标是全面掌握企业数据资产、降低用数门槛、提升用数体验。同时,推动企业内部形成“人人都是分析师”的文化氛围。为此,我们提出三个关键方向:一是数据产品化将成为数据资产从资源态到服务态的重要载体;二是数据产品经理将成为数据人才建设中的“灵魂人物”;三是一站式数据工作台将加速推动金融机构的数据平民化进程。

(2)4项扩展能力,即通过“盘评治享”打造新一代数据治理体系,持续管理“好”企业的高价值数据资产。

所谓“盘”,是指 全面盘点数据资产的家底。通过数据资产盘点,明确数据资产范围,自动化构建数据资产目录,盘点数据资产内容,打造数据资产标签体系,通过可视化和智能化手段,支持各类用户快捷高效、便捷查询和了解数据资产情况,摸清底数。所谓“评”,是指评估数据资产价值。针对资产价值、效能、质量、活性和安全等不同维度,建立对数据资产的评价方法,以量化的方式描述和评价数据资产,便于数据生产者、数据管理者和数据消费者更准确地了解数据资产的状态。所谓“治”,是指通过数据资产治理,从数据资产可用性的角度提升数据质量。新一代数据治理机制的关键点在于“全链路数据治理”,抓住数据生产源头,强化业务系统元数据管理,从源头消除数据标准不落地问题,推动治理工作迁移,将规范设计嵌入研发体系,形成全链路数据治理能力,从而解决设计与运行、线下与线上两张皮的现象。所谓“享”,是指数据资产服务与共享。以数据资产在企业内部的充分流动、高效共享,实现用户端侧价值为首要目标,具体工作围绕着数据产品化、服务计价和服务运营几个方面展开。3.数字应用

借用“消费者运营”的理念,贯穿客户全生命周期、围绕“人-货-场”三个核心要素的数字化运营体系,建立业务通、数据通、技术通的跨业务单元和技术团队的高效协同能力(见图6)。

图6 数字化运营体系核心三要素

阿里云刘伟光:金融行业全域数据“观”

所谓“人”,是指客户经营数字化。通过客户行为画像,让金融机构可以深度挖掘海量的客户线索,针对不同客户在不同阶段的活动喜好或需求,推荐差异化产品和服务。通过数据驱动业务流程,优化决策分析,与客户形成互助共赢的紧密关系,真正培育出金融机构的长期黏性客户。所谓“货”,是指产品运营精细化。结合客户经营管理的数字化能力,形成不同客群、不同阶段、不同需求的个性化产品精细化运营体系。金融机构采用数据分析算法,通过产品组合提供相应产品定价和推广建议,使客户可一键完成购买的交易过程,同时跟进市场和需求变化情况动态调整,并建立跨业务条线的合作模式,实现产品服务精准、客户服务专享等体验的大幅提升。所谓“场”,是指—渠道生态多样化。构建数字渠道的关键在于构建用户承接渠道矩阵,连接用户教育到用户转化,形成和客户的多层次连接。通过多样化的渠道建设,解决金融服务“最后一公里”难题。主要包括三层:一是新媒体流量运营,打造品牌心智;二是可交互渠道,加深用户理解产生黏性;三是自有渠道,提供全链路金融服务。每层场的定位和运营策略都有差异,结合客户分层,通过不同的“场”实现“人和货”的协同。4.运营保障机制

运营机制是数据体系持续发展、数据价值逐步释放的关键驱动力。它是通过战略及目标、组织及制度的制定和拆解,从数据资产及运营、数据平台工具及运营、数据产品及运营的维度分别建立配套工作目标、组织架构、数字人才等一系列运营保障机制。

业务视角下的价值链

图7 从不同部门视角提升经营管理能力

阿里云刘伟光:金融行业全域数据“观”

金融数据能力建设的成功要素

Capital One创始人理查德·D·费尔班克(Richard D.Fairbank)曾说过:“我们不是一家银行,我们是一家以数据作为基础战略的公司,只不过我们公司第一个成功的产品碰巧出现在银行业。”数据能力是未来金融企业的第一能力,数据能力越强的企业,边际效应越强、业务扩展越轻松、产品服务越精细化。

关键能力和价值方向

金融行业的数据体系建设应注重以下价值方向:一是降低数据建设成本;二是进行全链路数据集成与治理;三是实施一站式数据研发和服务;四是满足多样化的数据服务体验;五是强化数据产品经理的培养与塑造(见图8)。

图8 金融数据能力建设价值方向

阿里云刘伟光:金融行业全域数据“观”

关键路径与成功要素

一是通过数据体系评估,形成适合自身发展的数据体系成熟度评估模型,并制定企业数据战略;二是准确把握数据中台模型与数仓模型的关键差异,合理选择最佳数据模型(传统数仓是数据驱动,周期长,但模型稳定);数据中台是业务场景驱动,见效快,但模型变化频繁;三是充分考虑传统数仓的演进路径,从技术架构、数据模型、平台兼容性、业务对数据需求等评估,选择数仓平迁、数仓升舱或数据中台重构方案,在迁移中还应考虑语法兼容性、工具便捷性,确保成本和风险双降、服务效率和价值双升;四是建设统一数据服务平台,提供统一门户支持数据的资产分类和数据管理,提供稳定的、高效的、安全的全域数据服务;五是强化全员的数据责任意识,通过治理体系优化,明确相应的责权利;六是构建多维度企业数据资产共享,释放数据价值。

↓↓ 点击“阅读原文”可下载阅读4万字全文

评论