发表评论取消回复
相关阅读
相关 数仓工具—Hive进阶之权限管理(7)
Hive 权限管理 权限管理是为了验证某个用户是否有执行某项操作的权限,安全认证是为了认证用户是合法用户,今天我们主要介绍的是权限管理而不是安全认证 集群安全下需求:
相关 数仓工具—Hive进阶之SerDe(6)
Hive SerDe SerDe是Serializer/Deserializer的缩写。序列化是对象转换成字节序列的过程。反序列化是字节序列转换成对象的过程。 对象的序
相关 数仓工具—Hive进阶之数据存储格式(5)
行存储与列存储 当今的数据处理大致可分为两大类,联机事务处理 OLTP(on-line transaction processing)联机分析处理 OLAP(On-
相关 数仓工具—Hive进阶之执行计划(4)
执行计划explain 执行计划这个东西无论是在hive里还是数据库管理系统中都是很重要的,因为它可以帮助我们理解SQL的执行,从而更好的去优化SQL,而不是一味的凭经验
相关 数仓工具—Hive进阶之事务剖析(3)
事务 上一节我们学习了如何让Hive 支持 insert values(…),delete和update,以及Hive 事务的配置和实现的基本原理,接下来我们具体看一下它
相关 数仓工具—Hive进阶之事务初识(2)
事务 1. 背景 在我们使用的hive中一般它是不会支持事务的,因为hive的存储基于HDFS,HDFS 的文件,只能允许新建,删除,对文件中的内容进行更新,不允许
相关 数仓工具—Hive进阶之索引(1)
索引 Hive从0.7.0版本开始引入了索引,目的是提高Hive表指定列的查询速度。没有索引的时候,Hive在执行查询时需要加载整个表或者整个分区(分区表并提供了相
相关 数仓工具—Hive优化
数据过滤 行过滤 行处理:在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤, 列过滤 列处理
相关 数仓工具—Hive实战之拉链表(3)
拉链表初识 需要查看历史某一时间节点的状态,同时考虑到存储空间;或则适用于数据会发生变化,但是大部分是不变的 > 在数据仓库的数据模型设计过程中,经常会遇到下面这种表的
还没有评论,来说两句吧...