每周一次的演示
加入我们的专家为现场每周演示
通过加入Cloudera产品专家每周现场演示,了解CDP的最新特性和功能,并获得紧迫问题的答案。
使用Cloudera机器学习构建基于人工智能的web应用程序
2022年8月4日星期四
了解Cloudera机器学习(CML)如何使数据科学从业者快速向业务用户交付基于ml的web应用程序。
该演示将演示用户如何发现和接收数据集,使用他们最熟悉的库或语言训练ML模型,使用API快速部署ML模型,以及为业务用户构建一个与ML模型的API交互的web应用程序。
视频
通过视频了解CDP的好处。
了解CDP解决的用例,并学习如何成功部署和使用Cloudera数据平台的全部范围。
教程
![教程](http://www.studiofcn.com/content/dam/www/marketing/images/banners/lg/lg-tutorials-1213513755.jpg)
帮助构建、部署和扩展的教程
通过详细的教程优化您的时间,这些教程清楚地解释了部署、使用和管理Cloudera产品的最佳方式。
事件
![Apache Iceberg: Looking Below the Waterline Apache冰山的活动横幅:水线以下的混合Meetup](http://www.studiofcn.com/content/dam/www/marketing/cdp-users/hybrid-meetup-2022-12-08-banner.png)
Meetup
特殊混合事件-阿帕奇冰山:看水线以下
2022年12月8日,星期四
在很短的时间内,Apache Iceberg已经成为大数据领域最受欢迎、发展最快、被广泛采用的开放表格式。它解决了一些已知的大数据痛点,包括数据一致性、可伸缩性、性能、模式和分区演变。在这次会面中,您将听到开源社区中领导和推动Iceberg增强和路线图的主要合作伙伴的发言。我们的议程排得满满的;以下是我们计划进行的四场演讲的摘要:
用于BI用例的Apache Iceberg
本次演讲将涵盖冰山开放表格式与Apache Hive和Impala计算引擎的集成,冰山v1和v2功能支持,客户用例以及未来在Cloudera的冰山增强和创新。我们将详细介绍Hive和Impala支持的以下功能:
- 关键的功能和性能增强
- 物化视图支持
- 就地迁移Hive外部表到Iceberg表
- 行级更新/删除
- 表回滚
- 表的维护
了解Teranet如何利用Spark和Impala利用Apache Iceberg进行变更数据捕获用例,以跟上不断变化的业务增长和需求。
Apache冰山的多功能分析
本节将演示如何将Spark与Iceberg表一起使用,重点介绍Iceberg的主要特性。我们将展示Spark与Hive和Impala的互操作性。在此过程中,我们将介绍Cloudera为改进Iceberg上的Spark和Impala支持所做的贡献。
Apache Iceberg的REST目录-数据工作流之外的实际和潜在用途
Iceberg的新REST目录为由Iceberg支持的数据仓库提供的丰富元数据和功能提供了一个友好的访问点。这使得Iceberg更容易集成到计算引擎中,并且几乎可以从您能想到的任何客户端进行目录操作。然而,REST目录的力量还不止于此。在数据平台的边缘,有无数的工具和特性可以从REST目录设计中获益良多。在这次演讲中,我们想要介绍一些目前存在的创造性用途,以及一些可能存在的富有想象力的用途。
使用Apache Iceberg的增量压缩
在Linkedin, Kafka主题形式的流数据通过Apache Gobblin支持的低延迟摄取管道摄取到数据湖。这通常会导致更小的文件包含重复的记录,这是由于至少一次交付语义,这导致创建另一组管道,以消除重复数据的正确性,并将其压缩到更大的文件中以提高存储和查询效率。
由于它们的批处理性质,这些压缩管道具有爆发性、计算密集型和更高的延迟。随着数据量的增加,以增量方式处理/计算数据以优化资源利用率和降低延迟变得越来越重要。在这次演讲中,我们将介绍Linkedin如何利用Iceberg将其压缩管道从批处理模型迁移到增量处理模型,并解决此类延迟和计算问题。我们还展示了这如何提高整体集群资源利用率和更均匀的工作负载分布。此外,我们还将关注如何根据后期数据优化压缩和重复数据删除。
下面的注册链接将提示您登录您的Linked In帐户:
过去的虚拟聚会
请通过YouTube观看我们最近举办的一些“虚拟聚会”,这些“虚拟聚会”是由我们的未来数据网络的本地聚会小组之一举办的,以了解为什么全球超过49,000名数据从业者选择使用Cloudera产品和服务。bob投注下载
- 特别混合活动:Apache Ozone用户组峰会
加州硅谷- 2022年11月10日 - 丰富您的数据内联与Apache NiFi
哈里斯堡,宾夕法尼亚州- 2022年10月26日 - 使用CSP CE在不到5分钟内部署有状态流管道
德克萨斯州奥斯汀- 2022年9月21日 - 你好,火花!在云中使用PySpark的Apache Spark的介绍
马萨诸塞州波士顿(和硅谷)- 2022年6月9日 - 使用scikit learn和Applied ML原型预测今年的NBA冠军
德克萨斯州奥斯汀- 2022年5月25日 - 在云中使用Apache Iceberg进行多功能分析
哈里斯堡,宾夕法尼亚州- 2022年3月24日 - 顺化有什么新鲜事?最新的功能,功能和创新
哈里斯堡,宾夕法尼亚州- 2022年1月19日
下一站-建立从边缘到洞察的数据管道
Tui Leauanae和Nicolas Pelaez
本系列博客跟踪一家联网汽车制造商的制造、运营和销售数据,这些数据通常在处于当前技术前沿的大型制造公司中经历阶段和转变。
数字化转型是一个从边缘到洞察的数据之旅
Tui Leauanae, David LeGrand, Nicolas Pelaez著
这是六部分博客系列的第一部分,概述了从边缘到人工智能的数据之旅,以及数据在这一过程中产生的商业价值。数据旅程不是线性的,但它是一个无限循环的数据生命周期——从边缘开始,在数据平台中编织,并产生应用于真正的业务关键问题的业务迫切洞察,从而产生新的数据主导的计划。
社区
![一群人在谈话和开会](http://www.studiofcn.com/content/dam/www/marketing/cdp-users/community%20image%20users.jpg)
探索Cloudera社区
加入Cloudera社区,与超过69,000名同行联系,讨论超过18,000个解决方案。
如何连接Go应用程序到Cloudera操作数据库
Cloudera Operational Database (COD)体验是一个托管的dbPaaS解决方案。它可以根据集群的工作负载利用率自动扩展,并将在今年晚些时候添加自动调优(在现有基础设施占用范围内提高性能)和自动修复(自动解决操作问题)的功能。
Cloudera教育服务bob投注下载
![CDP Training CDP培训](http://www.studiofcn.com/content/dam/www/marketing/images/banners/lg/lg-users-training-intro-to-cml.jpg)
CDP培训
通过Cloudera教育服务的课程,与世界领先的专家一起磨练您的大数据技能。bob投注下载
专业服务bob投注下载
借助Cloudera SmartServices专业知识加速成功bob投注下载
通过Cloudera专家的实际技术见解,快速、经济、安全地从试点转向生产。我们全面的服务组合为您提供正确的产品和支持,从启动到加速和扩展bob投注下载部署,帮助您缩短从CDP获得价值的时间。
![一群人在谈话和开会](http://www.studiofcn.com/content/dam/www/marketing/images/banners/lg/lg-group-at-table-935639900.jpg)
SmartMigrate:迁bob投注下载移到Cloudera数据平台的服务
升级现有的CDH和HDP部署,并迁移到CDP数据中心,同时最大限度地降低风险、业务中断和SLA违规。
文档
所有Cloudera产品的技术内容的中央存储库。
查找按产品和任务分解的指南、快速入门、手册和最佳实践。