为分析构建基础
使用单个存储平台消除数据孤岛。通过分层存储和策略管理优化成本。使用 Azure Active Directory (Azure AD) 和基于角色的访问控制 (RBAC) 对数据进行身份验证。借助静态加密和高级威胁防护等安全功能,帮助保护数据。
通过自动异地复制实现无限制的缩放和 16 个 9 的数据持久性
高度安全并具有灵活的跨数据访问、加密和网络级控制的保护机制
用于引入、处理和可视化的单一存储平台,支持最常见的分析框架
通过独立缩放存储和计算、生命周期策略管理和对象级分层实现成本优化
缩放以匹配要求最苛刻的分析工作负载
借助 Azure 全局基础结构,满足任何容量要求并轻松管理数据。以始终如一的高性能运行大规模分析查询。
利用灵活的安全机制
通过涵盖加密、数据访问和网络级控制的功能保护数据湖,所有这些功能都旨在帮助你更安全地获得见解。
为分析构建可缩放的基础
使用各种不同的数据引入工具大规模引入数据。使用 Azure Databricks、Synapse Analytics 或 HDInsight 处理数据。并通过 Microsoft Power BI 对数据进行可视化,从而获取转型见解。
构建具有成本效益的数据湖
通过独立缩放存储和计算来优化成本,这是本地数据湖无法实现的功能。根据使用情况上调或下调层级,并利用自动化生命周期管理策略来优化存储成本。
内置的全面的安全性和符合性
-
Microsoft 每年在网络安全研发方面的投资超过 USD 10 亿美元。
-
我们雇佣了超过 3,500 名安全专家专门负责数据安全和隐私。
-
Azure 拥有比任何其他云提供商都多的认证。查看完整列表。
针对构建数据湖提供灵活定价
从包括分层、预留和生命周期管理在内的定价选项中进行选择。
受到各种规模公司的信赖
Ahmed Adnani,史密斯集团应用和分析主管"With Azure, we now have the capability to rapidly drive value from our data. The actionable insights from the data models we're creating will help us increase revenue, reduce costs, and minimize risk."
James Ferguson,Marks & Spencer 产品经理"Microsoft Azure gives us good value when we need huge clusters for a couple of days to do a job, then lets us get rid of them to conserve, whereas the datacenter is almost completely unfeasible. That was a big, big game-changer for us."
Brad Beechler,高级机器学习科学家"Operating on Azure, we have opportunities to improve of the speed, range, accuracy, and localization of our forecasts—it's just a question of what to prioritize first."
有关 Data Lake Storage 的常见问题解答
-
在 Blob 上添加分层命名空间可以保留云存储的成本优势,而不影响大数据分析框架设计时适用的文件系统接口。
有一个反复出现的分析作业的规律可以作为简单的示例,分析作业将输出数据写入临时目录,然后在提交阶段将该目录重命名为最终名称。在对象存储中(根据设计不支持目录的概念),这些重命名可能是涉及 N 个复制和删除操作的冗长操作,其中 N 是目录中的文件数。使用分层命名空间时,这些目录操作是原子操作,可提高性能、减少成本。此外,支持目录作为文件系统的元素时,就可以应用与 POSIX 兼容的、使用父目录传播权限的访问控制列表(ACL)。
-
与其他云存储服务类似,Data Lake Storage 根据存储的数据量以及对该数据执行操作所产生的成本计费。请参阅成本明细。
-
Data Lake Storage 主要用于使用 Hadoop FileSystem 作为其数据访问层(例如 Spark 和 Presto)的所有框架。查看详细信息。
在 Azure 中,Data Lake Storage 集成了:
- Azure 数据工厂
- Azure HDInsight
- Azure Databricks
- Azure Synapse Analytics
- Power BI
该服务还集成到了围绕 Azure Blob 存储的大规模成熟的生态系统中。
-
Data Lake Storage 为数据访问控制提供了多种机制。通过提供分层命名空间,该服务是唯一采用符合 POSIX 的访问控制列表 (ACL) 的云分析存储,该列表构成了 Hadoop 分布式文件系统 (HDFS) 权限的基础。Data Lake Storage 还包括通过存储防火墙、专用终结点、强制执行 TLS 1.2 和使用系统或客户提供的密钥的静态加密实现的传输级安全功能。