本报记者 郝亚娟 张荣旺 上海 北京报道
近日,中国人民银行、发改委等七部门联合印发《推动数字金融高质量发展行动方案》(以下简称“《方案》”)。
《方案》要求金融机构完善数据质量管控和治理体系,全面整合内外部数据资源,实现全域数据统一管理和融合共享。
《中国经营报》记者在采访中了解到,如何整合数据资源成为银行下一步发力点。兴业研究金融监管高级研究员任图南指出:“我国银行业在2025年展业中面临的最重要机遇将是由公共数据资源开发所带来。”
高质量数据是AI基础
《方案》明确发展数字金融的目标是为了金融更好地服务经济发展,同时提出“到2027年年底,基本建成与数字经济发展高度适应的金融体系”的总体目标。
苏商银行金融科技实验室指出,《方案》的实施,为金融行业注入了全新的发展动能。数字化转型使金融机构在市场响应能力和客户服务能力上实现质的飞跃,助力提升整体竞争力。前沿技术的应用不仅推动了金融产品的更新迭代,也带来了全新的服务模式,激发了行业创新潜力。与此同时,基于数据驱动的智能风控体系,将使风险管理更加精准、及时,为金融机构在复杂多变的市场环境中保持稳健运营提供坚实保障。
任图南告诉记者,2024年9月到10月,我国密集发布多项政策破解公共数据资源开发中存在的机制性障碍,2025年或将成为公共数据资源开发大潮的起点。在数字金融的三个层次(数据要素应用、金融科技运用、银行展业方式数字化)中,我国银行业在2025年展业中面临的最重要机遇将是由公共数据资源开发所带来的。
记者采访了解到,金融行业是数据密集型行业,大规模且高质量的数据将为银行业务提供有力支撑。全球网络安全领导企业Palo Alto Networks(派拓网络)发布的一项预测指出,2025年,与新成立的AI初创公司相比,拥有大量客户和数据资源的大型企业将在网络安全领域占据明显优势。这些大型企业可以获取大量高质量的数据,并使用这些数据提高AI模型的性能,实现竞争优势。
《2024年毕马威银行业首席执行官展望》调研发现,81%的受访首席执行官表示,生成式人工智能仍是其最优先的投资选择。大多数受访者(65%)预计此项投资在三到五年内可获得回报。他们也特别提到对此类技术在大力改善欺诈识别和网络安全功能、数据分析、运营效率和客户服务个性化方面的潜力充满期待。
交通银行相关人士表示,在数据要素成为生产要素的背景下以及生成式人工智能带来的颠覆性变革下,商业银行的数据治理工作需要顺应要素化、智能化的趋势,持续把握数据治理的服务目标要求和工作主线,以应对数字经济时代的新变量。
银行如何加强数据融合?
在深挖数据价值的同时,数据安全与合规重要性凸显。多家银行提出强化数据安全管理,提升数据安全防护能力以及降低数据安全风险。
苏商银行金融科技实验室分析,《方案》要求金融机构完善数据质量管控和治理体系,全面整合内外部数据资源,实现全域数据统一管理和融合共享。深化“数据要素×”应用模式,借助大数据、隐私计算等技术优化风控模型和金融产品设计。在降低数据采集成本方面,《方案》提出利用全国信用信息共享平台和公益性融资信用服务平台,帮助金融机构获取高质量数据,降低数据使用门槛和成本。
值得注意的是,数据价值的提升也带来了数据安全、数据治理方面的挑战。Commvault亚太地区副总裁Martin Creighan接受记者采访时指出,在云计算的时代,出现了私有云、公有云以及多个公有云的混合环境。同时,数据量随着技术发展尤其是人工智能的普及呈现爆炸式增长,这使得数据孤岛的问题更加严重。企业必须认识到,在数据治理方面,尤其是管理数据孤岛,需要一个统一的平台,能够全面掌握本地、私有云和公有云的整体数据情况。然而,企业通常仅针对数据孤岛构建数据保护和恢复方案,而忽视了如何应对意外或不可预见情况对数据恢复能力的影响。针对这一问题,企业需要通过单一平台来全面解决这一问题,从根本上提升数据治理能力,保障数据的安全性与可用性。
前述交通银行相关人士也表示,商业银行丰富的金融服务场景需要多领域数据的融合,《“数据要素×”三年行动计划(2024—2026年)》提供了契机,但如何在现有数据要素市场规范和交易机制下,规避供需双方沟通成本高、信任度不够、交易成本高等问题,拓展数据融合的安全边界,仍需要各方持续探索与共建。
从交通银行的实践来看,该行构建纵跨“数据、模型、知识”三个层次的数据供给能力。
在数据层面,构建全覆盖的底层数据资产目录,在结构化数据之外,拓展非结构化数据版图,加快推进对文本、图片、音视频等非结构化数据资产的梳理,支撑人工智能应用的精准定位与前置转化。
在模型层面,做好指标、标签、模型等信息的萃取提炼与统筹管理。大模型与小模型共存的格局将长期存在,项目组级的“烟囱式”模型及模型特征的重复开发愈发普遍,需搭建企业级模型特征库,实现模型及模型特征数据的“一次治理、多场景复用”,提升模型搭建效率。
在知识层面,建立企业级知识沉淀与运营机制,构建高效合规的数据标注体系,明确知识沉淀规范,推动企业内部的“隐性知识”向“显性知识”转变,打造全行知识库,降低沟通成本;组建专业团队,研究标注规则和工作流程,加强数据审查和脱敏,充分满足人工智能数据标注合规化、专业化要求,提供安全合规、准确高效的训练数据集,形成标注质量与模型效果的正向循环。
(编辑:朱紫云 审核:何莎莎 校对:张国刚)