济南戴尔存储经销商告诉我们,传统的企业数据管理方案是建立数据仓库,相较于数据仓库只能处理结构化数据(如关系型数据库中的表),数据湖显得“包容”得多,它可以轻松收集各种数据,包括存储结构化数据,半结构化数据(如CSV、日志、XML、JSON),以及非结构化数据(如文本、图形、图像、音频、视频)。
济南戴尔存储经销商指出,国际数据公司IDC预测,到2023年,中国的数据量将达到40ZB,其中超过80%是非结构化数据。非结构化数据在共享、搜索和分析等使用过程中具有持续价值,它所反映的信息蕴含着诸多企业效益提高的机会。数据湖这种对多态数据结构的容纳能力正是未来企业不可或缺的。
正是基于大数据时代客户对非结构数据管理需要的洞察。
济南戴尔存储经销商告诉我们,此前,戴尔科技针对预测性大数据分析发布了横向扩展数据湖方案,帮助客户捕获大数据的价值,实现存储空间和性能的线性增长,从而保持更低的获取与管理的成本。通过旗下PowerScale和ECS(Elastic Cloud Storage)等文件和对象存储产品,戴尔易安信多年来持续为各行业客户提供完整、可靠的数据湖解决方案。
济南戴尔存储经销商表示,由于数据湖存储着来自业务线应用程序的关系数据,以及来自移动应用程序、IoT设备和社交媒体的非关系数据。捕获数据时,未定义数据结构或Schema。这意味着企业可以对数据使用不同类型的分析(如SQL查询、大数据分析、全文搜索、实时分析和机器学习)来获得信息。
数据湖适合以一致的方式利用大量数据,并使用算法驱动实时分析。如今,数据传输以及通信都需要实时运行,特别是气象测控、金融服务、网络监控等领域会产生大量的实时动态数据,对于持续生成动态新数据的大多数场景,采用流数据处理是有利的。