发布时间:2023-10-16 | 阅读:
数据要素是金融行业高质量发展的重要驱动力。为更好地激发数据要素价值,推动金融数据从资源向资产跨越,数据仓库成为越来越多银行数字化转型基础设施建设的核心工具。数据仓库能够帮助金融行业从大量、多样的数据中提取有价值的信息,支持数据分析和决策,优化业务流程,降低成本,提高业务效率和风险控制能力,提升行业竞争力等。
随着实时计算、实时数仓的发展,以及业务需求推动,传统数仓逐渐向实时数仓演进。与传统数仓相比,实时数仓更加注重数据的实时性和对业务的实时响应能力。作为数据规模最为庞大、数据能力要求最高的行业之一,金融机构需要金融实时数仓来打通数字化与价值创造之间的路,推动数据资产价值提升。
然而,通过实时数仓推动金融数据从“资产”通向价值创造的路上,仍需破解一系列难题:
数据分析实时性差:对金融交易、行为等海量重要数据的实时分析能力不足(T+1)
复杂查询效率低:在海量数据多维分析查询、多表联合复杂查询场景下响应慢
自主研发安全可靠:要求对关键信息基础设施形成自主研发能力,保障系统安全可靠
技术成本高:系统兼容差,技术栈复杂,研发、运维、扩展等技术成本高
针对传统数据仓库在大规模数据复杂分析场景下存在的性能、并发和智能化瓶颈,柏睿数据采用全内存分布式OLAP计算引擎、机器学习建模平台等自研产品,构建极致性能、安全可靠、灵活演进的新一代金融级实时数仓,加速金融机构打造全域数据能力,实现分析查询实时性、并发性、智能性的指数级提升,满足银行实时业务应用、实时风险监测、实时决策等业务需求。
柏睿数据金融级实时数仓解决方案以具有完全知识产权的全内存分布式数据库RapidsDB为核心,可提供金融级统一的大数据分析平台技术方案,具备高性能、高可用、高可扩展、高可靠性等优势特性。
RapidsDB不仅是完全自研、安全可控的国产数据库,还在查询性能方面远优于同类国内外MPP产品,成功破解了传统数仓的性能瓶颈。在多表关联中,RapidsDB在复杂场景中优势更显著:
在5表关联、每表1亿条数据量的多条件复杂查询下,RapidsDB在1秒内完成结果反馈。
在5表关联、每表10亿条数据量的多条件复杂查询的情况下,RapidsDB只需3.3秒即完成了查询结果反馈。
具备复杂多表查询能力的数据库,不仅能够通过灵活实时的查询满足业务端更多的应用场景需求,还能在数据开发端降低开发难度与建设成本。在支持OLAP工作负载外,RapidsDB还可支持OLTP及HTAP混合工作负载,全面满足大数据时代的金融机构数据驱动战略需求。同时,其稳定性、并发数、兼容性等综合性能及项目实施、运维服务方面也具有较优的应用体验。
全域数据无缝集成
从源头对接实时/批量/增量数据流,实现数据采集的事件驱动;20+多源异构数据统一集成
T+0高性能
数据快速读取、压缩,秒级加载,智能化全流程建模,实现复杂OLAP场景下的实时分析
安全可靠
独立自主知识产权的存储计算引擎,代码自主率高达99.32%;完整的ACID事务能力,保障数据准确可靠
技术生态灵活演进
完全兼容ANSI SQL、Hadoop生态系统,通过丰富的API集合与BI等应用工具平滑对接
随着金融科技赋能实体经济持续深化,某国有头部银行基于柏睿全内存分布式数据库RapidsDB,打造行内关键的金融级大数据分析平台,助力数字普惠金融服务发展,促进“融资难、融资贵、融资慢”问题的解决。
该行在客户管理系统的数据集成层引入RapidsDB,与现有的云化数据仓库相配合使用。由云化数仓将客户数据进行数据集成后,加载进RapidsDB,RapidsDB则根据该银行的客户评价与细分业务的需要,向全行上万名客户经理提供数据及时查询与在线数据分析等服务。
在前端监控方面,柏睿数据Rapids Manager可实现监控生产环境系统、集群、数据库、告警、自愈等功能,为核心业务系统的运行维护保驾护航。
通过柏睿新一代金融级实时数仓,该行不仅完成了对国外数据库的平滑替代,还实时高效支撑了全行5万多名客户经理的业务开展,千亿行数据量、大并发的多表复杂查询,做到秒级响应。有力解决了业务原系统查询响应时间长、总体拥有成本高等问题,同时实现了普惠金融服务质效、信贷风险管理等能力的提升。项目实施效果获得行方高度评价。
随着社会的不断进步,数据技术的不断发展,每个阶段的业务形态也随之发生变化,技术工具、方法等也不断地延伸、迭代。未来,柏睿数据将持续以“Data+AI”技术为核心,推动金融行业数据资产化,释放数据新价值,不断探索如何为金融机构提供更加高效、精准的数据智能服务。