在pandas的unstack时报ValueError: duplicate entries 错误


pandas是python中用于数据分析和处理的一个基于numpy的基本库工具,是从事python语言数据领域的一个基本入门工具,常见用途有:
a提供高级的数据结构和相当丰富的数据操作API
b提高了对复杂矩阵运算的效率(这里的矩阵,目前可简单视作Excel数据表,自己脑补一下)
c提供了数据清洗和处理功能
d帮助数据挖掘挖掘分析回归正题:代码如下(环境:anaconda3+python3)

运行代码时:
pandas两个重要的数据结构:Series和DataFrame
对象方法unstack(): Series对象的API,用于将Series的数据类型转DataFrame类型,因为DataFrame提供的数据操作API远远多于Series。(Series视作一维,DataFrame视作高维数据,类比一维数组和高维度数组)
用unstack操作的数据必须唯一标识,而打印obj1如下:

存在重复,unstack不能唯一区分,故转换失败报错ValueError: Index contains duplicate en 香港云主机tries, cannot reshape, 解决方式:修改字母索引名或者数字索引,只要能够唯一标识即可,如将重复的1改为2(这里不能为3)或改为字母
将层次索引的外层索引(这里指a,b,c)作为DataFrame的行索引,内层索引(1,2,3….)作为列索引.结果打印如下:
思考一下: 既然Series转DataFrame,可使用unstack()[解包], 那DataFrame转Series用什么方法?
答案: 使用stack() [打包]

相关推荐: html设置图片位置实例分析

今天小编给大家分享一下html设置图片位置实例分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。html设置图片的位置的方法是,给图片添加bac…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 07/23 17:00
下一篇 07/23 17:00

相关推荐