parquet学习

àì夳堔傛蜴生んèń 2023-07-25 11:21 75阅读 0赞

Parquet的那些事（一）基本原理

Parquet的那些事（二）Spark中的Schema兼容问题

Parquet的那些事（三）嵌套数据模型

发表评论取消回复

表情：

评论列表（有 0 条评论，75人围观）

还没有评论，来说两句吧...

相关阅读

相关 parquet学习

[Parquet的那些事（一）基本原理][Parquet] [Parquet的那些事（二）Spark中的Schema兼容问题][Parquet_Spark_Schema]

àì夳堔傛蜴生んèń/ 2023年07月25日 11:21/ 0 赞/ 76 阅读

相关 Impala中的parquet存储压缩

在Impala中，parquet存储格式的默认压缩方式为snappy。通过以下命令可以修改该配置： set compression\_code=snappy; (snapp

向右看齐/ 2023年06月12日 04:18/ 0 赞/ 149 阅读

相关 parquet文件格式解析

> 参考资料: > https://parquet.apache.org/documentation/latest/ > https://www.jianshu.com

怼烎@/ 2023年02月13日 14:37/ 0 赞/ 181 阅读

相关 python读parquet文件 pandas读parquet文件

如何使用gzip压缩后的parquet文件安装 pandas and pyarrow: pip install pandas pyarrow

迷南。/ 2023年01月19日 07:21/ 0 赞/ 338 阅读

相关 spark sql 读取 parquet 文件

SQL 你可以使用spark-sql -S启动 sql的 spark。 CREATE TEMPORARY VIEW parquetTable US

逃离我推掉我的手/ 2022年12月19日 06:12/ 0 赞/ 293 阅读

相关 parquet列式存储格式

一、历史背景 Parquet是Hadoop生态圈中主流的列式存储格式，它使用 Google 的 Dremel 论文中概述的技术，列式存储嵌套的数据结构（传说中3秒查询1PB的

布满荆棘的人生/ 2022年11月03日 11:18/ 0 赞/ 617 阅读

相关 Parquet介绍及简单使用

> 什么是parquet Parquet 是列式存储的一种文件类型官网描述： Apache Parquet is a columnar storage format

桃扇骨/ 2022年10月02日 10:58/ 0 赞/ 430 阅读

相关转Parquet文件

介绍： Apache Parquet is a columnar storage format available to any project in the Hadoop

分手后的思念是犯贱/ 2022年05月13日 15:16/ 0 赞/ 581 阅读

相关查看Parquet格式文件

[Parquet 格式文件，查看Schema][Parquet _Schema] > 需要工具：[parquet-tools-1.6.0rc3-SNAPSHOT.jar]

Dear 丶/ 2021年10月23日 12:26/ 0 赞/ 1138 阅读

相关创建parquet类型的hive外表

前面一篇文章中，介绍过如何使用flink，消费kafka数据，并且将数据以parquet格式sink到hdfs上，并且sink的时候使用了天、小时的方式进行了分桶策略。详情见：

╰+哭是因爲堅強的太久メ/ 2021年09月01日 08:58/ 0 赞/ 511 阅读