Apache Beam

Google的东西总是自带光环,Apache Beam已成为 Apache顶级项目,从今天开始正式翻译Apache Beam,同时也作为毕设的任务之一,希望我的翻译工作能为大家的学习提供方便。欢迎持续关注我的博客http://blog.geekidentity.com/categories/beam/

Apache Beam

Apache Beam提供了高级的统一编程模型,允许你实现可以在任何执行引擎上运行的批处理和流数据处理作业。

Apache Beam 是:

  • UNIFIED (统一的) - 对批处理和流使用情况使用单个编程模型。
  • PORTABLE (轻便的) - 在多个执行环境(包括Apache Apex,Apache Flink,Apache Spark和Google Cloud Dataflow)上执行管道。
  • EXTENSIBLE (可扩展的) - 编写和共享新的SDK,IO连接器和转换库。

Get Started

要使用Beam 进行数据处理任务,请先阅读Beam 概述并执行快速入门中的步骤。 然后深入到文档部分,以获取有关Beam 模型,SDK和runners 的深入概念和参考资料。

Contribute

Beam是Apache Software Foundation项目,可在Apache v2许可下使用。 Beam是一个开源社区,非常感谢贡献! 如果您想贡献,请参阅贡献部分。