Apply函数进行数据预处理

墨蓝 2022-03-22 09:12 316阅读 0赞

Apply函数进行数据预处理

测试数据集：
包含两列：时间戳和字符串，大小为近8000行

在df中添加一列，使其全部都是a

将A列改的值为大写

df['A'] = df['A'].apply(str.upper)

使用apply进行预处理
将data数据拆分为三列

Apply接收一个函数作为参数，apply将会把指定列中的每一个值送给函数参数进行处理。

根据观察，data列的值其实是三个部分组成：
Symbol、Seqno、Price。
现在想把这一列变成三列。
就单个一个data的数据来说，可以用split方法进行拆分：

l1 = df['data'][0].strip().split(' ')
l1[1], l1[3],l1[5]  
>>>('APPL', '0', '1623')

定义一个用于处理所有数据的函数：

def foo(line):
    items = line.strip().split(' ')
    return Series([items[1], items[3], items[5]])
df_tmp = df['data'].apply(foo)  # 调用foo函数
df_tmp = df_tmp.rename(columns={0:"Symbol", 1:"Seqno", 2:"Price"}) # 给新的一行重命名

df_new = df.combine_first(df_tmp)  # 将新表和原表链接

删除多余的列并将文件写出csv：

Apply函数进行数据预处理

Apply函数进行数据预处理

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关使用Python进行数据清洗和预处理

相关如何利用Python进行数据清洗与预处理

相关如何对minist数据进行预处理

相关 Pandas数据预处理——drop_duplicates()函数

相关 R语言使用caret包的preProcess函数进行数据预处理：指数变换

相关 Elasticsearch使用Ingest Pipeline进行数据预处理

相关 matlab主要数据预处理函数,Matlab 神经网数据预处理的函数

相关 pipeline 和 painless对文档数据进行预处理

相关 Apply函数进行数据预处理

相关 Python apply函数

随便看看

Git 入门（附脑图）

端午节游长江之后浪

20 图解剑指Offer 包含min函数的栈 Java题解

个人博客 blog

Flink+Kafka如何实现端到端的exactly-once语义

【你也能看得懂得电磁场与电磁波系列连载 4】

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表