Python GUI编程怎么制作一个文档图片提取软件


本篇内容主要讲解“Python GUI编程怎么制作一个文档图片提取软件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python GUI编程怎么制作一个文档图片提取软件”吧!本文将进一步讲解如何用Python提取PDF与Word中图片,并结合之前讲解过的GUI框架PysimpleGUI,做一个多文件图片提取软件,效果如下:本文主要将分为以下部分讲解:PDF,Word,Excel文件图片提取构造图片提取器GUI框架整合代码并打包主要涉及的Python模块有:PILPySimpleGUIrewin32oszipfilefitz首先使用pip安装相关依赖模块在之前的文章有讲过,读取Excel有两种方法。一种是将后缀名改成.zip格式进行提取,一种是通过Pillow模块对Excel进行图片复制与保存。而在我们这次3种文件格式的图片提取当中,Excel提取图片方法和之前一样。Word中图片提取方法和通过.zip提取方法类似,PDF提取图片方法要用到新的模块。由于Excel中提取图片的两种方法在之前的文章讲过,故这里只讲解PDF和Word中的提取方法。和以前一样,我们先看代码再讲解这里的代码和GUI中通过.zip方式提取Excel图片的代码思路是一样的。“path = values[“lujing”]这里是读取GUI中键为**“ lujing” **的值,也即文件存储位置,用于os模块读取与操作。new_file = file.replace(“.docx”,”.zip”)是替换后缀名,如果是Excel的话,就把.docx改成.xlsx或xls。craterDir = values[“lujing”] + ‘/’这是存放zip文件的文件夹路径,注意此处重新到的键为“ lujing”的值后要在后面添加/。saveDir = values[“lujing”] + ‘/’这是存放图片的路径,同理,和上面一样加个/号。”最后说一下与Excel提取比例最大的不同是下面的代码if namelist[idx][:11] == ‘word/media/’:细心的读者可以发现,与Excel提取比例,中括号里面的值改了。很好理解,我们可以打印名称列表[idx],可以发现在索引0到10是’word/media/’所在位置。而在Excel中是前9位。感兴趣的读者可以翻看之前的文章,那里有对这段代码的详细解析,这里不多做介绍。和之前的excel提取图片一样,在一个pdf中加入4张图片,我们将它压缩为zip文件读取后相关代码如下:先说一下这段代码的思路吧,由于PDF不能像Excel和Word一样改后缀名进行提取,故这里运用python的一个模块PyMuPDF,过程如下阅读PDF并遍历每一页筛选无用的元素并用正则表达式获取图片生成并保存图片fitz.open(path)是打开PDF文件夹,这里的路径是需要在GUI界面中获取用户的文件放置路径于文件名的。这是我们的第一步重新并存历,将重新引入到的字符串内容放入到文本中由于PDF每页的背景就是一张图片,故我们可以通过宽高来寻找这些背景图片并用continue把他们剔除。我们通过实验发现图片所对应的字符串在checkxo与checkIM这两个中。故用正则表达式在文本中进行索引提取,用到了re模块的搜索函数。如果不是这两个字符串就用继续剔除。这是最后一步生成与保存图片“pix = fitz.Pixmap(doc, i)是生成图像语句,doc代表PDF文件,i代表遍历每个图片对象的索引值。img_name = “img{}.png”.format(imgcount)是设置图像名语句,用提取到的图片的序列号作为命名格式。”如果pix.n
由于代码采用的是def函数编写模式,故最后还要一个函数的初始化:if __name__ == ‘__main__’:至此,3种文件格式(Excel,Word,PDF)图片提取方法已全部讲解,接下来就是重中之重GUI生成了。先看完整代码:效果呈现:代码解析:做PySimpleGUI还是原来那个步骤:导入 创建一些小部件创建窗口创建事件循环当然,做GUI之前就是先想清楚自己的图形交互页面长什么样,像我就是现在纸上画一个大概,这样更有益于制作页面初步先引用模块第二步添加元素(小部件)到容器(layout)中,这里先介绍一下用到到的部件:“Menu:顾名思义,这是菜单栏,每个GUI都必带一个菜单栏来提示用户该如何做,我们这里用了menu_def这个布局来 香港云主机完成菜单的设置。Frame:这个跟layout布局完全相同,工作方式也一样,他们都是容器元素。可以看到“选项”那里是一个指示器的正方形,里面有四个选项,作用就是这个。注意,&这个符号的作用是创建相同类型的菜单,这里只有注意事项这一个菜单,故可以不用管,读者如果想添加同样的菜单的话必须添加一个&。tearoff=True这个参数是菜单栏中每个子选项上面加虚线。Radio:单选按钮。我们只可以在同样的id上选择一个选项。id就是指代码中的“ ra-dio1 ”。其中每个无线电函数的第一个参数是文本内容,这里就是我们要进行提取的4个文件格式。而“ size”就是位置,每行的第一个设置同样的参数(10,1)。最后就是我们进行事件帮忙的绑定键,其中“ enable_events”可以不写因为我们只是调用它而不用去对它产生事件。Text:之前有讲是不能改的正文内容。同样这里设置的位置参数(8,1),justification=’right’有点类似我们平常用的单词那个向右指向。InputText:需要用户输入的正文内容。这里有两个需要我们填充的地方:文件位置和文件名。这里需要设置键,因为在后面事件绑定中我们需要调用文件存储路径和文件名,在文中上半部分有提到过。FolderBrowse:简易的打开文件路径操作,不用你去复制路径。Submit:确定按钮,这里绑定为执行提取文档图片事件Cancel:退出主程序按钮。”第三步就是创建窗户来容纳这些元素布置。第四步创建事件循环,可以看到代码,都是一样的套路:当用户点击提交按钮时系统将进行判断你按的是该单选按钮,长长的进行相对应的事件执行。当你点击cancel或者时,就是退出主程序。当你按菜单中的注意时,就会弹出一个指示告诉你这个系统怎么用。在事件循环中,我们用values[]的布尔值来判断我们选的是哪个单选按钮,有读者疑问为什么不用event=,因为我们在第一个if当中用了eventso第二个if当中需要换一个判断方法。至此,GUI部分就搞定了!景点的读者可以继续在上面添加功能。我们将完整代码整合在一起,后安装pyinstaller模块如果你的上述项目代码文件命名为:photo.py。那么你要用以下命令进行打包最后打包成功之后,你会在py文件所在的文件夹看到一个dist的子文件夹。进去之后,找到pachong.exe文件并运行它即可。注意,文件夹里附带了很多文件,您可以删除它。当然,如果嫌麻烦就直接从photo.py文件用Python执行。到此,相信大家对“Python GUI编程怎么制作一个文档图片提取软件”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

相关推荐: C++中怎么防止溢出​

这篇文章将为大家详细讲解有关C++中怎么防止溢出,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Reason(原因)Overflow u 香港云主机sually makes your numeric algori…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/23 14:13
下一篇 08/23 14:14

相关推荐