Python如何利用Pandas处理复杂的Excel数据


本篇内容主要讲解“Python如何利用Pandas处理复杂的Excel数据”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python如何利用Pandas处理复杂的Excel数据”吧!问题缘起
pandas read_excel函数在读取Excel工作表方面做得很好。但是,如果数据不是从头开始,不是从单元格A1开始的连续表格,则结果会不是很好。比如下面一个销售表,使用read_excel读取:读取的结果如下所示:结果中标题表头变成了Unnamed,而且还会额外增加很多职位NaN列,字段为空的列的值也会被转换为NaN,这显然不是我们所期望的。header和usecols参数对这样的非标准格式的表格,我们可以使用read_excel()的header和usecols参数来控制选择的需要读取的列。结果的DataFrame包含了我们期望的数据。代码中使用header和usecols参数设定了用于显示标题的列和需要读取的字段:header参数为一个整数,从0开始索引,其为选择的行,比如1表示Excel中的第2行。usecols参数设定选择的Excel列范围范围(A-…),例如,B:F表示读取B到F列。在某些情况下,可能希望将列定义为数字列表。比如,可以定义整数列数:这对对大型数据集(例 香港云主机如,每3列或仅偶数列)要遵循一定的数字模式,则这个参数方法会很有用。usecols还可以设定从列名列表读取。比如上面的例子也可以这样写:列顺序支持自由选择,这种命名列列表的方式实际中很有用。usecols支持一个回调函数column_check,可通过该函数对数据进行处理。下面是一个简单的示例:column_check按名称解析每列,每列通过定义True或False,来选择是否读取。usecols也可以使用lambda表达式。下面的示例中定义的需要显示的字段列表。为了进行比较,通过将名称转换为小写来规范化。回调函数为我们提供了许多灵活性,可以处理Excel文件的实际混乱情况。关于read_exce函数更多参数可以查看官方文档,下面是一个总结表格:结合openpyxl在某些情况下,数据甚至可能在Excel中变得更加复杂。在下面示例中,我们有一个ship_cost要读取的表。如果必须使用这样的文件,那么只用pandas函数和选项也很难做到。在这种情况下,可以直接使用openpyxl解析文件并将数据转换为pandas DataFrame。比如要读取下面示例的数据:加载整个工作簿:查看所有工作表:[‘sales’, ‘shipping_rates’]要访问特定的工作表:要查看所有命名表的列表:dict_keys([‘ship_cost’])该键对应于Excel中分配给表的名称。这样就可以设定要读取的Excel范围:’C8:E16’这样就获得了要加载的数据范围。最后将其转换为pandas DataFrame即可。遍历每一行并转换为DataFrame:结果数据框:到此,相信大家对“Python如何利用Pandas处理复杂的Excel数据”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

相关推荐: PHP中CI框架的运行模式是什么

本篇内容主要讲解“PHP中CI框架的运行模式是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“PHP中CI框架的运行模式是什么”吧!1、创建了控制器2、视图代码到此,相信大家对“PHP中CI框架的运行模式是什么”…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 11/12 21:39
下一篇 11/12 21:39

相关推荐