文件读取与存储

小鱼儿 2023-06-03 02:48 113阅读 0赞

pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。

CSV

pandas.read_csv(filepath_or_buffer, sep =’,’ )
- filepath_or_buffer:文件路径
- usecols:指定读取的列名，列表形式
- sep-分割字符默认’,’
读取文件,并且指定只获取’open’, ‘close’指标 data = pd.read_csv(“./data/stock_day.csv”, usecols=[‘open’, ‘close’])
to_csv
- DataFrame.to_csv(path_or_buf=None, sep=’, ’, columns=None, header=True, index=True, mode=’w’, encoding=None)
  - path_or_buf :string or file handle, default None
  - sep :character, default ‘,’
  - columns :sequence, optional
  - mode:’w’：重写, ‘a’ 追加
  - index:是否写进行索引
  - header :boolean or list of string, default True,是否写进列索引值

HDF5

HDF5文件的读取和存储需要指定一个键，值为要存储的DataFrame

从h5文件当中读取数据

pandas.read_hdf(path_or_buf，key =None，** kwargs)
- path_or_buffer:文件路径
- key:读取的键
- return:Theselected object
DataFrame.to_hdf(path_or_buf, key, \kwargs)
- key:指定保存的键名

JSON

read_json—读取文件
- orient—指定读取数据的字典格式
- records—一行一个记录{列名:值,}
- lines—是否分行—一个记录一行
DataFrame.to_json(path_or_buf=None, orient=None, lines=False)
- 将Pandas 对象存储为json格式
- path_or_buf=None：文件地址
- orient:存储的json形式，{‘split’,’records’,’index’,’columns’,’values’}
- lines:一个对象存储为一行
to_json—存储文件—注意:lines=True

优先选择使用HDF5文件存储

HDF5在存储的时候支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的
使用压缩可以提磁盘利用率，节省空间
HDF5还是跨平台的，可以轻松迁移到hadoop 上面

转载于//www.cnblogs.com/oklizz/p/11488677.html

发表评论取消回复

表情：

评论列表（有 0 条评论，113人围观）

还没有评论，来说两句吧...

相关阅读

相关文件读取与存储工具类

/ 文件读取与解析帮助者类，用于读取指定文件，解析文件 @All rights reserved. / publi

绝地灬酷狼/ 2023年07月03日 10:56/ 0 赞/ 135 阅读

相关文件读取与存储

pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。 ![1552472-20190908214524536-1291410531.png

小鱼儿/ 2023年06月03日 02:48/ 0 赞/ 114 阅读

相关 python CSV 文件读取存储例子

我想读取一个CSV文件，然后只取前几条数据，之后存储成为一个新的文件，代码很简单，注意看注释哦 import csv 这个是我要读取的csv，文件名

妖狐艹你老母/ 2023年03月03日 11:16/ 0 赞/ 38 阅读

相关 Android 存储数据之1 读取文件和存储文件

Android文件存储的方式并不适合用于保存一些较为复杂的文本数据. TextUtils.isEmpty(inputText),非常好用,它可以一次性判断两种空值

偏执的太偏执、/ 2022年09月24日 07:30/ 0 赞/ 332 阅读

相关 Python 读取/存储 yaml 文件

YAML 是 "YAML Ain't a Markup Language"（YAML 不是一种标记语言）的递归缩写。在开发的这种语言时，YAML 的意思其实是："Yet Ano

拼搏现实的明天。/ 2022年09月16日 04:58/ 0 赞/ 458 阅读

相关 [数据存储之三]文件的读取

- (void)viewDidLoad { [super viewDidLoad]; /写入文件，有的话替换，没有的话新建/

谁借莪１个温暖的怀抱￠/ 2022年08月21日 04:49/ 0 赞/ 291 阅读

相关 [数据存储之五]JSON文件读取

- (void)viewDidLoad { [super viewDidLoad]; /读取json/ NSString

秒速五厘米/ 2022年07月29日 10:46/ 0 赞/ 324 阅读

相关 [数据存储之四]XML文件读取

import "ViewController.h" @interface ViewController () @end

绝地灬酷狼/ 2022年07月29日 09:20/ 0 赞/ 331 阅读

相关【Python】Pandas科学计算（一）——基本文件读取与存储

更新时间：2018-07-30 前言这一系列博客主要介绍Pandas科学计算，使用Pandas进行数据科学计算更高效、更简单。 Pandas读取文件后会生成

ゝ一纸荒年。/ 2022年05月19日 05:20/ 0 赞/ 324 阅读

相关 numpy 文件的存储与读取

需要了解两个函数名： tofile 和 fromfile 两个函数。tofile输出的数据没有格式，因此用numpy.fromfile读回来的时候需要自己格式化数据。

一时失言乱红尘/ 2022年02月20日 13:48/ 0 赞/ 373 阅读