cannot index with vector containing NA / NaN values

àì夳堔傛蜴生んèń 2021-12-11 05:21 287阅读 0赞

关于这个小问题,其实是pandas使用中经常出现的问题。具体原因就是在dataframe里面nan是一个特殊的存在,因为你的数据里包含nan或者inf类型的数据类型,所以你在对这一数据进行处理时,就会出现标题上出现的错误。

怎么解决呢?

方法也是有很多的,这里举一个简单的方法,但是绝对不是最科学的方法,

  1. df['近期销量']=df['近期销量'].replace(np.nan,'0').astype(int)
  2. df=df.sort_values(by='近期销量',ascending=False)

这里是用字符串形式的0将nan给替换了,当然你也可以用pandas里面的fiina()函数进行处理,但是要注意处理的范围,因为数据里的维度比较多,很可能将所有的nan都处理掉了。

  1. df[['城市','省份']]=df[['城市','省份']].fillna('暂无')

总结:在进行数据处理之前,要对数据内容进行预处理,预处理是就要对数据的异常值进行处理,这是要保证数据的质量问题,也是保证数据分析结果的科学性。

发表评论

表情:
评论列表 (有 0 条评论,287人围观)

还没有评论,来说两句吧...

相关阅读