目前用过的所有的第三方库--需要安装
1、requests模块Python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。
作用:模拟浏览器发请求。
import requests
r = requests.get("https://api.github.com/events")
print(r) # <Response >
print(type(r)) # <class 'requests.models.Response'>
print(r.status_code) # 200
pypinyin 汉子拼音转换模块
pip3 install pypinyin 切换到项目所在文件夹后,运行即可
from pypinyin import lazy_pinyin
a = '赵乾舟'
b = lazy_pinyin(a,style=0)
c = ''.join(b)
print(b) #['zhao', 'qian', 'zhou']
print(c) #zhaoqianzhou openpyxl
目前用于把得到的数据,保存到excel里
import os
from openpyxl import Workbook
wb = Workbook()
sheet = wb.active
print(os.listdir()) #打印当前目录所有文件名,打印出来是列表类型
for i in os.listdir(): #遍历列表里的所有文件名
sheet.append() #把文件名都加到sheet里
wb.save('文件名.xlsx') #保存excel文件
lxml
from lxml import etree
lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高
xpath表达式
PyPDF2
pdfplumber
PDF提取文字的库,只限于可以复制的PDF文档,如果是图片合成的pdf,需要用ocr技术才行 PyMuPDF
在PDF转图片那一篇里用到,装这个库后,可以导入fitz库,操作PDF转png
详情可看http://zhaoqianzhou.com/forum.php?mod=viewthread&tid=314&extra=page%3D1 cv2模块
需要安装opencv
pip3 install opencv-python
在压缩图片中用到此模块 pandas库
操作excel常用的库 pillow 在批量压缩图片案例中用到 pyttsx3
语音朗读模块
页:
[1]
2