cloudera平台_Cloudera将共享数据平台的首个应用推向beta测试
Cloudera Inc .在5月推出了第一款基于Altus平台的应用即服务。
即将进入beta测试的Cloudera Altus Analytic DB,是一个专门用于自助服务的基于云的数据仓库。它在共享数据、目录和目录服务的基础上工作,因此不需要重复数据和提取/转换/加载数据。
该公司表示,它正在解决数据孤岛的问题,随着多个用户要求访问大数据存储,数据孤岛激增。该公司表示,支持同一数据的多个副本会使一致性、安全性和治理变得复杂,而短集群通常会消失。业务用户经常被阻止执行他们自己的特殊分析,因为数据是由工程师绑定在一起的。
Altus分析数据库利用共享的数据体验,使多个用户能够使用他们喜欢的工具,包括SQL、Python和altus数据工程。使数据科学家和工程师能够快速提供Apache Spark、Apache Hive、Spark上的Hive和云基础设施上的Map Reduce,并为亚马逊网络服务公司的S3对象存储提供初步支持,并计划在未来特定日期支持微软公司的Azure。
该公司表示,数据工程师可以读写云对象存储,而无需复制数据或更改文件格式。不需要将数据移入数据库,也没有预处理。
Cloudera产品管理总监格雷格?格雷格莱恩说:“查询引擎可以直接与数据进行比较。”您可以将原始数据加载到S3,然后使用像Impala这样的东西将其转换为优化的格式。或者可以在这个过程中进行转换,直接输入Spark作业,Spark作业会将Apache Parquet文件输出到S3。查询引擎只需要知道表的定义。
像Apache Impala一样,这个产品是一个巨大的并行Hadoop分析数据库。Cloudera是在2012年根据开源许可证开发和发布的。拉恩说:“对于熟悉Impala工作负载的人来说,这是向云的无缝过渡。
Cloudera高级产品营销经理Alex Gutow表示,与Altus一起,“业务分析师可以立即自行分析和访问全面的数据,并且可以支持广泛的工作负载。”或者用户用例的数量是无止境的,无论运行多少其他工作负载,工作负载都是可预测的。“使用不会影响性能或满足服务级别的协议,”她补充道。
据该公司称,由于不需要将数据移动到数据库中,共享数据和相关的数据模式和结构几乎可以被用户选择的任何工具访问。据Gutow称,Cloudera拥有超过3000个合作伙伴的网络,并与所有领先的商业智能工具合作。该公司提供了阿卡迪亚数据公司、信息公司、Tableau软件公司、Qlik公司和Zoom数据公司的证词。
未指定定价。客户可以加入等候名单,以获得更多关于可用性的详细信息。