Python 爬虫实例 100 例
第 1 例:使用 BeautifulSoup 从 HTML 解析数据
要素:
- HTML 解析
- BeautifulSoup 库
第 5 例:使用 Selenium 爬取动态加载的页面
要素:
- Web 浏览器仿真
- Selenium 库
第 10 例:使用 Requests 库发送 HTTP 请求
要素:
- HTTP 请求
- Requests 库
第 15 例:使用 Urllib 库发送 HTTP 请求
要素:
- HTTP 请求
- Urllib 库
第 20 例:使用 Scrapy 框架构建可扩展的爬虫
要素:
- 爬虫框架
- Scrapy 框架
第 25 例:使用 lxml 库解析 XML 数据
要素:
- XML 解析
- lxml 库
第 30 例:使用 Pandas 库处理表格数据
要素:
- 数据处理
- Pandas 库
第 35 例:使用 Numpy 库进行数值计算
要素:
- 数值计算
- Numpy 库
第 40 例:使用 Pytest 库编写爬虫测试用例
要素:
- 单元测试
- Pytest 库
第 45 例:使用 Asyncio 库实现异步爬虫
要素:
- 并发编程
- Asyncio 库
第 50 例:使用 Puppeteer 库在无头浏览器中爬取页面
要素:
- 无头浏览器
- Puppeteer 库
第 55 例:使用 Watir 库在浏览器中自动化交互
要素:
- 浏览器自动化
- Watir 库
第 60 例:使用 Splash 库渲染 JavaScript
要素:
- JavaScript 渲染
- Splash 库
第 65 例:使用 TensorFlow 库进行图像识别
要素:
- 图像识别
- TensorFlow 库
第 70 例:使用 Opencv 库进行图像处理
要素:
- 图像处理
- Opencv 库
第 75 例:使用 PyPDF2 库解析 PDF 文件
要素:
- PDF 解析
- PyPDF2 库
第 80 例:使用 Tweepy 库爬取 Twitter 数据
要素:
- 社交媒体爬虫
- Tweepy 库
第 85 例:使用 Facebook Graph API 爬取 Facebook 数据
要素:
- 社交媒体爬虫
- Facebook Graph API
第 90 例:使用 Instagram API 爬取 Instagram 数据
要素:
- 社交媒体爬虫
- Instagram API
第 95 例:使用 Google Search API 爬取 Google 搜索结果
要素:
- 搜索引擎爬虫
- Google Search API
第 100 例:使用 Amazon Product API 爬取亚马逊产品数据
要素:
- 电子商务爬虫
- Amazon Product API