业务挑战




如何实现异构数据快速融合?

如何快速安全共享数据?

如何让数据为业务所用?

如何让数据提供价值?



产品架构


数据湖平台基于大数据生态组件开发,引入微服务和容器架构,承载数据采集、存储、加工和对外开发功能,在实现数据快速接入和全面管控的同时,提供可视化的数据交互服务,让数据所见即所得。












图片关键词



产品特点

原始数据存储

海量原始数据集中存储,无需加工,包括源系统数据的原始副本,以及用于报告、可视化、分析和机器学习等任务的转换数据

多类型数据支持

包括来自关系数据库(行和列)的结构化数据,半结构化数据(CSV,日志, XML, JSON),非结构化数据(电子邮件,文档, PDF)和二进制数据(图像,音频,视频),将不同种类的数据汇聚到一起

按需计算

使用者按需处理,不需要移动数据即可计算。数据库通常提供了多种数据计算引擎供用户来选择。常见的包括批量、实时查询、流式处理、机器学习等

延迟绑定

数据湖提供灵活的,面向任务的数据编订,不需要提前定义数据模型





应用场景


图片关键词


应用价值


数据湖中的数据最接近原生的,这对于数据探索类需求,带来很大便利,可以直接得到原始数据。


数据湖统一内部各个业务系统数据,解决信息孤岛问题,为横跨多个系统的数据应用,提供一种可能。


数据湖提供全局的、统一的企业级数据概览视图, 这对于数据质量、数据安全,直到整体的数据治理,提高到数据资产管理。


改变原有工作模式,鼓励人人了解、分析数据,不依赖于专门的数据团队的“供给”方式,

可提升数据运营效率、改善客户互动、鼓励数据创新。