概述
在任何规模下安全地简化和操作数据管道。
CDP数据工程是唯一专为企业数据工程团队构建的云原生服务。基础上Apache火花, Data Engineering是一个包罗一切的数据工程工具集,通过Apache workflow、高级管道监控、可视化故障排除和综合管理工具实现编排自动化,以简化企业分析团队的ETL流程。
数据工程与Cloudera数据平台,实现端到端可见性和安全性对有关以及与CDP服务的无缝集成,例如bob投注下载数据仓库而且机器学习.CDP的数据工程支持在任何地方的混合云平台上一致、可重复和自动化的数据工程工作流程。
用例
处处自动化数据管道
获得ETL可视性和控制权
始终保持数据完整性
处处自动化数据管道
将高质量的数据集安全地交付给CDP数据仓库、CDP机器学习或任何其他分析工具。
数据工程简化了从机器学习到数据仓库等分析团队的数据管道。通过编排和自动化管道,以安全透明的方式在任何地方交付精心策划的高质量数据集,加快实现价值的时间。
获得ETL可视性和控制权
全面透明地管理数据生命周期。
当试图大规模地跨企业操作数据管道时,管理数据生命周期和控制成本变得越来越复杂。
Data Engineering为容量规划、管道自动化、自动谱系捕获和跨业务用例故障排除提供了一套操作控制和可见性特性。
![暗示可见性和控制的抽象形象](http://www.studiofcn.com/content/dam/www/marketing/images/banners/products/thumb-data-engineering-visibility.png)
始终保持数据完整性
完整的数据管道可见性,以保护您的业务。
随着数据数量和复杂性的增长,确保在整个业务中扩展分析工作负载的持续准确性和保真度可能很困难。
数据工程提供原生数据管道监控和警报,以便及早发现问题,并提供可视化故障排除,以便在问题影响业务之前快速解决问题。
![数据管道故障排查截图](http://www.studiofcn.com/content/dam/www/marketing/images/banners/products/thumb-data-engineering-troubleshooting.png)