CDP资源

培养使用Cloudera数据平台进行创新的技能

通过为开发人员、分析师、数据科学家、架构师和管理员量身定制的内容和工具,了解最新的Cloudera技术。

每周一次的演示

加入我们的专家为现场每周演示

通过加入Cloudera产品专家每周现场演示,了解CDP的最新特性和功能,并获得紧迫问题的答案。

使用Cloudera机器学习构建基于人工智能的web应用程序

2022年8月4日星期四

了解Cloudera机器学习(CML)如何使数据科学从业者快速向业务用户交付基于ml的web应用程序。

该演示将演示用户如何发现和接收数据集,使用他们最熟悉的库或语言训练ML模型,使用API快速部署ML模型,以及为业务用户构建一个与ML模型的API交互的web应用程序。


CDP演示
  • 探索性数据分析揭示迫切业务问题的答案[完整的记录
  • 探索性数据科学用于发现和可视化数据,以构建机器学习模型[完整的记录
  • 通用数据分布将数据从任何来源连接到任何目的地[完整的记录
  • 采用Cloudera数据平台(CDP)的多级数据管道[突出
  • Cloudera共享数据体验(SDX)的安全与治理[突出
  • 使用Cloudera DataFlow (CDF)流式数据[突出
  • 企业机器学习与Cloudera机器学习(CML) [突出
  • Cloudera数据仓库(CDW)分析[突出
  • 使用Cloudera操作数据库开发应用程序[突出
视频

通过视频了解CDP的好处。

了解CDP解决的用例,并学习如何成功部署和使用Cloudera数据平台的全部范围。


旅游

亲身体验CDP

点击下面开始交互式CDP产品之旅

CDP tour CDF介绍
CDP公有云服务bob投注下载
CDP tour CML介绍
CDP tour CDH介绍
更多CDP旅游
CDP tour CDW介绍
CDP tour COD介绍
CDP tour SDX介绍

帮助构建、部署和扩展的教程

通过详细的教程优化您的时间,这些教程清楚地解释了部署、使用和管理Cloudera产品的最佳方式。

CDP之旅NiFi数据站介绍
带气流的CDP tour CDE管道
减少CDP旅游
教程
教程

帮助构建、部署和扩展的教程

通过详细的教程优化您的时间,这些教程清楚地解释了部署、使用和管理Cloudera产品的最佳方式。

如何创建CDP私有云基础开发集群

如何创建CDP私有云基础开发集群

介绍CDP私有云基础(试用版)的安装过程。

使用Cloudera操作数据库创建一个简单的Web应用程序

使用Cloudera操作数据库创建一个简单的Web应用程序

使用Cloudera操作数据库(COD)和机器学习(CML)创建一个简单的web应用程序。

在CDP混合云上使用Spark处理DICOM文件

在CDP上使用Spark处理DICOM文件

使用CDP (Cloudera Data Platform)上的CDE (Cloudera Data Engineering)将MRI产生的DICOM文件转换为PNG图像。

使用NVIDIA RAPIDS加速AI训练

使用NVIDIA RAPIDS加速CDP混合云中的AI训练

探索如何在Cloudera数据平台(CDP)上使用Cloudera机器学习(CML)利用NVIDIA的RAPIDS框架。

事件
Apache冰山的活动横幅:水线以下的混合Meetup
Meetup

特殊混合事件-阿帕奇冰山:看水线以下


2022年12月8日,星期四

在很短的时间内,Apache Iceberg已经成为大数据领域最受欢迎、发展最快、被广泛采用的开放表格式。它解决了一些已知的大数据痛点,包括数据一致性、可伸缩性、性能、模式和分区演变。在这次会面中,您将听到开源社区中领导和推动Iceberg增强和路线图的主要合作伙伴的发言。我们的议程排得满满的;以下是我们计划进行的四场演讲的摘要:

用于BI用例的Apache Iceberg

本次演讲将涵盖冰山开放表格式与Apache Hive和Impala计算引擎的集成,冰山v1和v2功能支持,客户用例以及未来在Cloudera的冰山增强和创新。我们将详细介绍Hive和Impala支持的以下功能:

  • 关键的功能和性能增强
  • 物化视图支持
  • 就地迁移Hive外部表到Iceberg表
  • 行级更新/删除
  • 表回滚
  • 表的维护

了解Teranet如何利用Spark和Impala利用Apache Iceberg进行变更数据捕获用例,以跟上不断变化的业务增长和需求。

Apache冰山的多功能分析

本节将演示如何将Spark与Iceberg表一起使用,重点介绍Iceberg的主要特性。我们将展示Spark与Hive和Impala的互操作性。在此过程中,我们将介绍Cloudera为改进Iceberg上的Spark和Impala支持所做的贡献。

Apache Iceberg的REST目录-数据工作流之外的实际和潜在用途

Iceberg的新REST目录为由Iceberg支持的数据仓库提供的丰富元数据和功能提供了一个友好的访问点。这使得Iceberg更容易集成到计算引擎中,并且几乎可以从您能想到的任何客户端进行目录操作。然而,REST目录的力量还不止于此。在数据平台的边缘,有无数的工具和特性可以从REST目录设计中获益良多。在这次演讲中,我们想要介绍一些目前存在的创造性用途,以及一些可能存在的富有想象力的用途。


使用Apache Iceberg的增量压缩

在Linkedin, Kafka主题形式的流数据通过Apache Gobblin支持的低延迟摄取管道摄取到数据湖。这通常会导致更小的文件包含重复的记录,这是由于至少一次交付语义,这导致创建另一组管道,以消除重复数据的正确性,并将其压缩到更大的文件中以提高存储和查询效率。

由于它们的批处理性质,这些压缩管道具有爆发性、计算密集型和更高的延迟。随着数据量的增加,以增量方式处理/计算数据以优化资源利用率和降低延迟变得越来越重要。在这次演讲中,我们将介绍Linkedin如何利用Iceberg将其压缩管道从批处理模型迁移到增量处理模型,并解决此类延迟和计算问题。我们还展示了这如何提高整体集群资源利用率和更均匀的工作负载分布。此外,我们还将关注如何根据后期数据优化压缩和重复数据删除。

下面的注册链接将提示您登录您的Linked In帐户:


过去的虚拟聚会

请通过YouTube观看我们最近举办的一些“虚拟聚会”,这些“虚拟聚会”是由我们的未来数据网络的本地聚会小组之一举办的,以了解为什么全球超过49,000名数据从业者选择使用Cloudera产品和服务。bob投注下载

CDP技术博客
使用NVIDIA RAPIDS从cpu切换到gpu进行纽约市出租车价格预测

使用NVIDIA RAPIDS从cpu切换到gpu进行纽约市出租车价格预测

作者:雅各布·本特森

这篇博客展示了用流行的基于CPU的Python库(如Pandas和Scikitlearn)构建的脚本来使用基于GPU的Python库(如cuDF和cuML)是多么容易。

下一站-预测数据与Cloudera机器学习

下一站-预测数据与Cloudera机器学习

罗伯特·赫里尼维奇著

本系列博客跟踪一家电动汽车制造商的制造和运营数据生命周期阶段(预测分析)——通常在大型数据驱动的制造公司中经验丰富。

下一站-建立从边缘到洞察的数据管道

下一站-建立从边缘到洞察的数据管道

Tui Leauanae和Nicolas Pelaez

本系列博客跟踪一家联网汽车制造商的制造、运营和销售数据,这些数据通常在处于当前技术前沿的大型制造公司中经历阶段和转变。

数字化转型是一个从边缘到洞察的数据之旅

数字化转型是一个从边缘到洞察的数据之旅

Tui Leauanae, David LeGrand, Nicolas Pelaez著

这是六部分博客系列的第一部分,概述了从边缘到人工智能的数据之旅,以及数据在这一过程中产生的商业价值。数据旅程不是线性的,但它是一个无限循环的数据生命周期——从边缘开始,在数据平台中编织,并产生应用于真正的业务关键问题的业务迫切洞察,从而产生新的数据主导的计划。

社区
一群人在谈话和开会

探索Cloudera社区

加入Cloudera社区,与超过69,000名同行联系,讨论超过18,000个解决方案。

如何连接Go应用程序到Cloudera操作数据库

Cloudera Operational Database (COD)体验是一个托管的dbPaaS解决方案。它可以根据集群的工作负载利用率自动扩展,并将在今年晚些时候添加自动调优(在现有基础设施占用范围内提高性能)和自动修复(自动解决操作问题)的功能。

见文章

Spark CDE结构化流示例

这个演示将使用NiFi从Twitter API中提取,写入一个名为“Twitter”的Kafka主题的有效负载。

见文章

如何为Cloudera数据工程配置k9

如何使用K9s获取Cloudera数据仓库体验的指标和日志,我决定为Cloudera数据工程创建相同的教程。流程非常相似,如下图所示。

见文章

Cloudera教育服务bob投注下载
CDP培训

CDP培训

通过Cloudera教育服务的课程,与世界领先的专家一起磨练您的大数据技能。bob投注下载

得到认证。脱颖而出。

专业服务bob投注下载

借助Cloudera SmartServices专业知识加速成功bob投注下载

通过Cloudera专家的实际技术见解,快速、经济、安全地从试点转向生产。我们全面的服务组合为您提供正确的产品和支持,从启动到加速和扩展bob投注下载部署,帮助您缩短从CDP获得价值的时间。

一群人在谈话和开会

CloudSmart: CDP公共云采用服务

评估云选项、优化数据和扩展分析,以信心和最小风险将工作负载转移到公共云。

得到CloudSmart

SmartMigrate:迁bob投注下载移到Cloudera数据平台的服务

升级现有的CDH和HDP部署,并迁移到CDP数据中心,同时最大限度地降低风险、业务中断和SLA违规。

得到SmartMigrate

SmartHealth:平台运行状况检查,以获得最佳性能

通过全面的平台部署和用例实现运行状况检查确保峰值性能。

得到SmartHealth

文档

所有Cloudera产品的技术内容的中央存储库。

查找按产品和任务分解的指南、快速入门、手册和最佳实践。

您的表单提交失败。

这可能是由以下原因之一引起的:

  • 您的请求超时了
  • 一个插件/浏览器扩展阻止了提交。如果您有广告拦截插件,请禁用它并关闭此消息重新加载页面。
Baidu