Slipstream中的并行流处理-蒲公英云

Slipstream中的并行流处理

   与[《Kafka中的消费者组》][Kafka]类似，Slipstream中多个流也可以同时接收同一topic的数据进行不同的操作。值得注意的是，Slipstream中的一个Input Stream对应着Kafka中的一个Consumer Group。

1、并行流的建立

   并行流的建立非常简单，在[《Slipstream中的衍生流》][Slipstream]建立的基础上，再建立一个新的输入流和衍生流即可，新建的输入流需与之前的输入流指向同一个topic。为了测试并行，这里指定新建的衍生流增加一个字符串截取的功能，如下：
create stream stream_b2 as select id,substr(name||pwd,1,4) as sp from stream_a2;

其中，stream_a2为新建的输入流。

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2dka3l4eTIwMTM_size_16_color_FFFFFF_t_70

2、并行流处理数据

创建Oracle测试表并启动Flume

此操作与《Slipstream中的衍生流》中创建Oracle测试表、启动Flume的操作相同。

触发流

创建一个表，用于接收stream_b2传过来的数据，例如：

CREATE TABLE table_c2 (id STRING, sp STRING);

最后，通过下列语句触发流：

INSERT INTO table_c SELECT * FROM stream_b;
INSERT INTO table_c2 SELECT * FROM stream_b2;

通过4044监控界面查看触发是否成功：

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2dka3l4eTIwMTM_size_16_color_FFFFFF_t_70 1

测试并行流

在Oracle中插入几条数据，如下：

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2dka3l4eTIwMTM_size_16_color_FFFFFF_t_70 2

查询table_c和table_c2中是否接收到了处理后的全部数据：

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2dka3l4eTIwMTM_size_16_color_FFFFFF_t_70 3

至此，并行流测试成功。

Slipstream中的并行流处理

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关 Java 8新特性：流（Stream）和并行处理

相关 Java并行流处理困惑：性能优化问题

相关 Java 8新特性：流和并行处理

相关 Java 8 并行流串行流

相关并行流parallelStream

相关 Slipstream中流与流、流与表之间的join

相关 Slipstream中的Window Stream（窗口流）

相关 Slipstream中的并行流处理

相关 Slipstream中的衍生流（Derived Stream）

相关 Slipstream中的高可用（HA）

随便看看

IDEA从SVN中导入多模块项目

Codeforces Edu Round 49 A-E

2019年6月的思考

手机科普贴告诉你RAM和ROM的真正区别

【jQuery】添加删除记录练习

个人小结：python包的几种下载方式

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表