发表评论取消回复
相关阅读
相关 Spark Streaming编程指南【快速入门】
一.概述 Spark Streaming是核心Spark API的扩展,可实现实时数据流【微批处理】的可伸缩,高吞吐量,容错流处理。数据可以从像kafka,flume,k
相关 Spark结构化流之join
一.join操作 结构化流支持将流数据集/数据帧与静态数据集/数据帧以及另一个流数据集/数据帧连接在一起。流连接的结果是增量生成的,类似于流聚合的结果。请注意,在所有受支
相关 Spark结构化流之水印
一.处理后期数据和加水印 现在考虑如果存在事件迟到了应用程序会发生什么。例如,应用程序在12:11接收在12:04(即事件时间)生成的单词。应用程序应使用12:04而不是
相关 Spark结构化流编程【Dataset、DataFrame】
一.DataFrame和DataSet的API 从Spark 2.0开始,DataFrame和Dataset可以表示静态的有界数据以及流式无界数据。与静态数据集/数据框类
相关 Spark结构化流编程指南【基础信息】
一.概述 结构化流是基于Spark SQL引擎构建的可伸缩且容错的流处理引擎。可以像对静态数据进行批处理计算一样来表示流计算。当流数据继续到达时,Spark SQL引擎将
相关 Apache Spark 3.0 GraphX编程指南
学习地址:[https://spark.apache.org/docs/latest/graphx-programming-guide.html][https_spark.a
相关 Apache Spark 3.0 DStreams-Streaming编程指南
目录 总览 一个简单的例子 基本概念 连结中 初始化StreamingContext 离散流(DStreams) 输入DStreams和接收器 基本资料 进阶
相关 Apache Spark 3.0 结构化Streaming流编程指南
目录 总览 快速范例 Scala语言 Java语言 Python语言 R语言 程式设计模型 基本概念 处理事件时间和延迟数据 容错语义 使用数据集和数据帧
相关 Apache Spark 3.0 RDD编程指南
RDD 是Apache Spark编程非常重要的一个特性。Spark使用Scala语言编写并支持Java和Python。 目录 总览 与Spark链接 Scal
相关 Spark Streaming-1:Spark Streaming编程指南
翻译:http://spark.apache.org/docs/latest/streaming-programming-guide.html 概述 Spark
还没有评论,来说两句吧...