跳到主要内容

Spark的StreamSets变压器

构建和管理基于Apache Spark构建的ETL和数据转换管道

没有复杂性的现代ETL管道

使用Spark的StreamSets变压器在几分钟内将无限数据转化为见解. StreamSets变压器运行在任何Apache Spark环境(砖, AWS EMR, 谷歌云Dataproc, 和Yarn). Spark的StreamSets变压器是一个数据管道引擎,设计用于任何 开发人员或数据工程师 建立和管理ETL和ML管道 在Spark上执行.

使用意图驱动的视觉设计工具创建执行ETL和机器学习操作的管道

解决Spark应用程序执行中无与伦比的可见性问题

无需重新设计就可以运行任何主要的Spark发行版和交换平台

运行在

无论现在还是将来,只要您的需求发展,都可以在任何地方运行Apache Spark.

Hadoop HDFS Apache Spark For ETL Processing
MapR Apache Spark For ETL Processing
Microsoft SQL Server Big Data Clusters Apache Spark For ETL Processing
StreamSets为砖

将数据转换操作化

为每个人简化Apache Spark For ETL

构建和管理在Spark上执行的ETL和ML管道

将强大的本地ETL放在任何数据工程师的指尖. 使用一个简单的, 拖放UI来创建用于执行ETL的高度仪器化管道, 流处理, 和 机器学习 操作. StreamSets数据操作平台可以帮助您的团队加速您的数据项目. 易于操作的代码和自动化关键的Spark操作通过一个中心平台.

为每个人解锁Apache Spark的力量

在多个Spark平台上运行

变压器发动机的设计,运行在所有主要的Spark分布,以最大的灵活性. 你可以在EMR、HDInsight和砖平台上原生执行.  在多个Spark平台上运行您的开发和生产项目,或者使用一个工具支持不同的业务单元需求,而无需返工.  

下载:Apache Spark的设计注意事项
Apache Spark执行的可见性
采用Apache Spark进行ETL和机器学习

查看哪些内容发生了变化,并轻松应对

管道中的完全可见性和无与伦比的弹性意味着当发生更改时,您可以停止在日志文件中查找错误. 对Transformer管道进行检测是为了提供对Spark执行的深度可见性,因此您可以在管道级别和管道中的每个阶段进行故障排除. Transformer提供了遗留ETL工具的企业级特性和生产力, 同时展示了Apache Spark的全部功能和灵活性.

观看演示:更改维度和沙巴体育手机版转换器

StreamSets数据操作平台

在几分钟内构建智能数据管道,并通过一次登录跨混合和多云平台部署.

AWS数据ops的数据工程
Azure上数据操作的数据工程
谷歌云上数据操作的数据工程
雪花上数据操作的数据工程
数据操作的数据工程
回到顶部

沙巴体育手机版使用cookie来改善您对沙巴体育手机版网站的体验. 单击“允许所有人同意”并继续访问沙巴体育手机版的网站. 隐私政策

(类^ =“wpforms——”)
(类^ =“wpforms——”)