Spark的StreamSets变压器 构建和管理基于Apache Spark构建的ETL和数据转换管道 开始请求一个演示没有复杂性的现代ETL管道 使用Spark的StreamSets变压器在几分钟内将无限数据转化为见解. StreamSets变压器运行在任何Apache Spark环境(砖, AWS EMR, 谷歌云Dataproc, 和Yarn). Spark的StreamSets变压器是一个数据管道引擎,设计用于任何 开发人员或数据工程师 建立和管理ETL和ML管道 在Spark上执行. 使用意图驱动的视觉设计工具创建执行ETL和机器学习操作的管道 解决Spark应用程序执行中无与伦比的可见性问题 无需重新设计就可以运行任何主要的Spark发行版和交换平台 ►运行在 无论现在还是将来,只要您的需求发展,都可以在任何地方运行Apache Spark. 看到所有的连接器 将数据转换操作化构建和管理在Spark上执行的ETL和ML管道 将强大的本地ETL放在任何数据工程师的指尖. 使用一个简单的, 拖放UI来创建用于执行ETL的高度仪器化管道, 流处理, 和 机器学习 操作. StreamSets数据操作平台可以帮助您的团队加速您的数据项目. 易于操作的代码和自动化关键的Spark操作通过一个中心平台. 为每个人解锁Apache Spark的力量 在多个Spark平台上运行 变压器发动机的设计,运行在所有主要的Spark分布,以最大的灵活性. 你可以在EMR、HDInsight和砖平台上原生执行. 在多个Spark平台上运行您的开发和生产项目,或者使用一个工具支持不同的业务单元需求,而无需返工. 下载:Apache Spark的设计注意事项 查看哪些内容发生了变化,并轻松应对 管道中的完全可见性和无与伦比的弹性意味着当发生更改时,您可以停止在日志文件中查找错误. 对Transformer管道进行检测是为了提供对Spark执行的深度可见性,因此您可以在管道级别和管道中的每个阶段进行故障排除. Transformer提供了遗留ETL工具的企业级特性和生产力, 同时展示了Apache Spark的全部功能和灵活性. 观看演示:更改维度和沙巴体育手机版转换器 StreamSets数据操作平台 在几分钟内构建智能数据管道,并通过一次登录跨混合和多云平台部署. 现在试一试 白皮书数据工程师手册:4种云设计模式白皮书Apache Spark部署的设计注意事项网络研讨会缓慢变化维度 & StreamSets变压器开始使用streamset视频教程设置和运行 文档去医生 社区分享你的成功