发布时间:2023-05-08 | 阅读:
自去年12月份“数据二十条”出台到今年3月份国家数据局成立,数据要素进入加速落地阶段,正成为数字中国建设的关键基础设施;各行业企业也积极从数据要素中更全面地挖掘价值,驱动新增长、新服务、新业态。多方聚焦正助推数据采集、分析、流通、交易等数据要素市场各环节发展完善。
如何在安全合规的前提下实现数据市场化的高效流通和深度应用,是数据要素市场多方主体积极探索的重点方向。对于各行业而言,最大限度打破数据壁垒、实现数据内外部的互联互通,有利于最大限度挖掘数据价值;对于企业而言,实现对海量多源异构、多模态数据的实时处理,并根据实际业务情况实现灵活多元的部署方式,不仅有利于业务复用和降本增效,更有利于企业释放数据增量价值,实现360°运营和业务创新,提升竞争力与成长性。这既需要数据确权、标准制定等层面的完善,也对承载全部数据分析的大数据平台提出了更多且更高的要求。 柏睿数据以“全内存分布式计算引擎”为核心,完全自主创新研发新一代高性能、标准化、全智能的数据智能产品体系,并致力于大数据技术在智能端与云端的战略升级,产品已渐次向云端部署,为全球客户提供跨云跨库、云湖仓一体化的数据实时分析解决方案。 基于柏睿云能平台,用户可以在华为云、阿里云、AWS、谷歌云等公有云、私有云、混合云及服务器自动化部署与管理柏睿数据具有完全自主知识产权的一体化流湖仓产品的集群,通过加载云存储数据的管道,自动把云存储中的数据高速加载到一体化流湖仓集群中,从而实现跨云跨库、云湖仓一体化。
该解决方案可以满足企业在建设大数据平台时跨云跨库等多数据源的海量异构、多模态数据的全域实时分析决策需求,具备高时效性、高安全性、高精确性和高性价比的核心优势,助力各行业企业全面突破数据割裂的“鸿沟”和数据壁垒,保障数据要素安全高效流通和深度应用,筑牢数字经济高质量发展的坚实底座。
该解决方案核心是弹性伸缩部署、湖仓一体、实时分析的能力。
基于底层统一的MPP技术架构,自动化部署与管理柏睿数据一体化流湖仓集群,并实现云原生在线自助扩容/缩容数据库节点,按需即买即用。
统一数据集成、数据湖、数据仓库的数据管理。集成ETL流程,提供流、批处理与CDC,跨20+异构数据源的数据实时或离线入湖;统一存储,统一元数据,统一访问,提供用户验证、访问控制、使用记账和审计全方位的安全功能;并对接上层多引擎、兼容多种软硬件与开源的数据生态。
统一的分布式内存 MPP 框架,无ETL方式的实时查询,优化云计算运行环境,可实现全域PB级规模多模数据存储,T+0实时在线分析,性能优于主流SQL分析引擎。
该解决方案有四大优势特性,助力企业高效、安全可靠、简单易用、更低成本地构建新一代云湖仓一体化的大数据平台。
吞吐量超Spark 40%,延迟低28%;离线同步速率超200000TPS,CDC平均时延低于4秒;TPC-H测试比主流产品快5倍,多表复杂查询性能卓越。
每个数据库集群都独立部署于云主机中,运行资源完全隔离;支持集群高可用、故障自愈,数据加密、多副本,保障业务持续性运营;实现“原始数据不出域”的集成融合。
通过柏睿数据云能平台,与云厂商API对接,实现数据库集群建立、删除等功能所需的云资源调度。多租户自主Portal,自主部署所需数据库、管理集群,集群整体运行情况、详细运行情况、主机状态等运行信息全面掌控;多语言OpenAPI便于数据集成。
即买即用,最大化利用计算资源;相同的数据量和云端运行环境测试,硬件资源占用少。