发表评论取消回复
相关阅读
相关 【大数据入门核心技术-Spark】(十三)Spark Streaming简介
一、环境安装 [【大数据入门核心技术-Spark】(三)Spark 本地模式安装][-Spark_Spark] [【大数据入门核心技术-Spark】(四)Spark S
相关 Spark Shuffle详解剖析
HashShuffle 一:概述 所谓Shuffle就是将不同节点上相同的Key拉取到一个节点的过程。这之中涉及到各种IO,所以执行时间势必会较长,Spark的Shuf
相关 Spark面试,Spark面试题,Spark面试汇总
Table of Contents 1、你觉得spark 可以完全替代hadoop 么? 2、Spark消费 Kafka,分布式的情况下,如何保证消息的顺序? 3、对于
相关 Spark入门(三)Idea构建spark项目
一、依赖包配置 scala与spark的相关依赖包,spark包后尾下划线的版本数字要跟scala的版本第一二位要一致,即2.11 pom.xml <?xml
相关 SparkRDD简介
参考文章:[spark的RDD中的action(执行)和transformation(转换)两种操作中常见函数介绍][spark_RDD_action_transformati
相关 Spark面试题整理(三)
1、为什么要进行序列化序列化? 可以减少数据的体积,减少存储空间,高效存储和传输数据,不好的是使用的时候要反序列化,非常消耗CPU。 2、Yarn中的containe
相关 Spark Scheduler内部原理剖析
Spark Scheduler内部原理剖析 分布式运行框架 Spark可以部署在多种资源管理平台,例如Yarn、Mesos等,Spark本身也实现了一个简易的资源管
相关 Spark Streaming架构原理剖析
文章目录 一、Spark Streaming 原理概述 二、DStream生成RDD实例的过程 1、什么是DStream
相关 常见的SparkRDD操作
常见的SparkRDD操作 sparkRDD的操作,从宏观上分为:Transformation和Action,但是具体的还以分为输入算子、变换算子、缓存算子,以及行动算子
还没有评论,来说两句吧...