移动端Python爬虫实战
数据抓取-数据存储-数据可视化 全流程讲解
本课程主要为同学讲解如何用Python实现App数据抓取,课程从开发环境搭建,App爬虫必备利器详解,项目实战,到最后的多App端数据抓取项目集成,到实现数据实时展示,带你向更优秀的Python爬虫工程师迈进!
适合人群
想学习数据抓取的你,
正在向Python爬虫工程师迈进的你,
这门课程绝对适合你!
技术储备要求
Python语法基础(函数封装,包调用、
TCP三次握手流程、Requests模块使用,
Python多线程,Python多进程)
[wm_tips]试看链接:https://pan.baidu.com/s/1wXgTpZQouMJEQZPJ45SJ3g
提取码:sc9d [/wm_tips]
章节目录:
-
第1章 2020版 第一章 移动端Python爬虫进阶实战课程导学 试看1 节 | 12分钟
介绍课程目标、通过课程能学习到的内容、学会这些技能能做什么,对公司业务有哪些帮助,对个人有哪些帮助。介绍目前app数据抓取有哪些困难,面临的挑战,本实战课程会利用哪些工具来解决这些问题,以及本实战课程的特点 ……
- 视频:1-1 移动端python爬虫进阶实战-2020版导学 (11:46)试看
-
第2章 2020 第二章 u2自动化抓取开发环境搭建 试看13 节 | 142分钟
介绍uiautomator2移动端自动化工具包含的核心模块,移动端自动化抓取开发环境的搭建,分别介绍windows平台和ubuntu平台通过uiautomator2连接移动设备,并介绍离线安装uiautomator2安装包
- 视频:2-1 u2自动化抓取工具介绍 (09:22)试看
- 视频:2-2 u2通信流程介绍 (09:21)试看
- 视频:2-3 u2自动化抓取开发环境搭建-1 (15:49)
- 视频:2-4 u2自动化抓取开发环境搭建-2 (16:50)
- 视频:2-5 u2自动化抓取开发环境搭建-3 (19:29)
- 视频:2-6 u2自动化抓取开发环境搭建-4 (16:48)
- 视频:2-7 u2自动化抓取开发环境知识点回顾 (07:15)
- 视频:2-8 如何连接真实移动设备并安装apk-windows环境-1 (09:22)
- 视频:2-9 如何连接真实移动设备并安装apk-windows环境-2 (02:30)
- 视频:2-10 如何连接真实移动设备并安装apk-ubuntu环境 (06:40)
- 视频:2-11 u2项目初始化 (06:16)
- 视频:2-12 u2连接移动设备的三种方式-1 (05:20)
- 视频:2-13 u2连接移动设备的三种方式-2 (16:58)
-
第3章 2020 第三章 u2定位元素方法19 节 | 197分钟
介绍uiautomator2移动端自动化工具的使用,如何操作设备,如何操作app,介绍通过weditor可视化工具获取app控件属性,介绍6中定位app控件方法,实战通过uiautomator2解锁移动设备九宫格,自动化登录考研app并滑动操控考研咨询信息
- 视频:3-1 u2自动化工具基本操作-操作设备 (13:17)
- 视频:3-2 u2自动化工具基本操作-操作app (19:12)
- 视频:3-3 APP activity和控件,weditor工具的安装 (08:13)
- 视频:3-4 weditor工具介绍和常见问题-1 (13:39)
- 视频:3-5 weditor工具介绍和常见问题-2 (07:48)
- 视频:3-6 UiSelector和控件定位介绍 (08:56)
- 视频:3-7 UiSelector文本定位方式 (11:14)
- 视频:3-8 UiSelector class定位方式-1 (01:10)
- 视频:3-9 UiSelector class定位方式-2 (04:31)
- 视频:3-10 UiSelector resourceId定位方式 (08:40)
- 视频:3-11 UiSelector混合定位方式-1 (04:52)
- 视频:3-12 UiSelector混合定位方式-2 (06:40)
- 视频:3-13 UiSelector 坐标定位方式 (02:27)
- 视频:3-14 控件操作和操作超时 (10:57)
- 视频:3-15 通过U2实现移动设备九宫格解锁 (12:54)
- 视频:3-16 xpath定位方式 (25:33)
- 视频:3-17 实现自动化登录考研帮app并滑动资讯信息-1 (12:57)
- 视频:3-18 实现自动化登录考研帮app并滑动资讯信息-2 (11:37)
- 视频:3-19 实现自动化登录考研帮app并滑动资讯信息-3 (11:45)
-
第4章 2020 第四章 爬虫必备利器、抓包工具的使用12 节 | 145分钟
本章着重介绍两款抓包工具的使用fiddler和mitmproxy。 首先介绍了fiddler抓包工具的工作界面、断点拦截、重定向、移动端设备抓包等功能 其次介绍了mitmproxy抓包工具的三个组件mitmproxy,mitmdump,mitmweb,介绍了三种常见无法抓包原因及解决方案…
- 视频:4-1 fiddler抓包工具介绍,file&&edit功能使用 (13:20)
- 视频:4-2 tooles功能使用 (12:55)
- 视频:4-3 rules功能使用&工具栏详讲 (11:09)
- 视频:4-4 会话列表-请求头、响应头介绍 (09:39)
- 视频:4-5 请求前断点设置,响应后断点,命令行请求前后断点设置,网页重定向 (12:45)
- 视频:4-6 手机安装证书,设置fiddler抓取移动端数据包 (11:03)
- 视频:4-7 mitmproxy软件移动设备安装证书、移动设备抓包 (11:40)
- 视频:4-8 mitmproxy数据包过滤 (08:10)
- 视频:4-9 mitmdump详讲。 (18:12)
- 视频:4-10 app无法抓包探秘-1 (21:54)
- 视频:4-11 app无法抓包探秘-2 (11:12)
- 视频:4-12 app无法抓包探秘-3 (02:47)
-
第5章 2020 第五章 短视频App数据抓取8 节 | 70分钟
介绍通过fiddler对短视频app视频接口,发布者信息接口进行了抓取和分析,通过uiautomator2操控短视频app滑动和点击,并通过mitmdump编写解析数据脚本
- 视频:5-1 短视频抓取需求分析 (06:48)
- 视频:5-2 安装vmware tools (09:46)
- 视频:5-3 通过U2实现滑动短视频-1 (07:39)
- 视频:5-4 通过U2实现滑动短视频-2 (08:23)
- 视频:5-5 通过U2实现滑动短视频-3 (06:44)
- 视频:5-6 通过mitmproxy解析短视频App返回数据-接口分析 (12:52)
- 视频:5-7 通过mitmproxy解析短视频App返回数据-编写mitmdump解析文件 (11:43)
- 视频:5-8 通过mitmproxy解析短视频App返回数据-运行并查看 (05:09)
-
第6章 2020 第六章 多设备管理atxserver2库4 节 | 68分钟
对多设备管理平台atxserver2进行了介绍,介绍atxserver核心组件,如何在ubuntu操作系统中通过手动方法安装atxserver2,并演示了如何通过atxserver2管理多台移动设备,实现了多设备同时抓取app应用数据
- 视频:6-1 atxserver2库介绍 (06:13)
- 视频:6-2 atxserver2通过pip安装部署 (18:30)
- 视频:6-3 atxserver2多设备管理库的使用 (22:51)
- 视频:6-4 实现多任务端app应用数据抓取系统 (20:24)
-
第7章 2020 第七章 elasticsearch17 节 | 202分钟
对实时的分布式搜索分析引擎elasticsearch进行了介绍,介绍了在ubuntu操作系统中安装elasticsearch和kibana组件,介绍了elasticsearch引擎的索引,mapping映射以及通过python增删改查文档数据,最终操作短视频数据存储到elasticsearch
- 视频:7-1 elasticsearch介绍和安装 (21:06)
- 视频:7-2 数据可视化组件kibana的安装和在elasticsearch基本的增删改查 (25:11)
- 视频:7-3 elasticsearch查询进阶 (10:48)
- 视频:7-4 elasticsearch查询排序 (02:56)
- 视频:7-5 elasticsearch分页查询 (03:00)
- 视频:7-6 布尔查询 (14:51)
- 视频:7-7 结果过滤 (02:24)
- 视频:7-8 高亮显示 (06:25)
- 视频:7-9 聚合函数查询 (08:42)
- 视频:7-10 分组查询 (07:59)
- 视频:7-11 _doc是用来做什么的 (05:39)
- 视频:7-12 elasticsearch mappings的三种模式 (22:39)
- 视频:7-13 elasticsearch的分词器 (21:00)
- 视频:7-14 修改elasticsearch的分词器 (07:33)
- 视频:7-15 倒排索引 (07:41)
- 视频:7-16 通过python操作elasticsearch增删改查 (18:21)
- 视频:7-17 通过python对elasticsearch批量添加数据 (15:25)
-
第8章 2020 第八章 数据可视化-kibana11 节 | 118分钟
对开源的数据分析和可视化平台kibana进行了介绍,介绍了基本图表,data图表,map图表,Timelion,通过Dashboard展现相关数据
- 视频:8-1 向elasticsearch导入示例数据 (19:25)
- 视频:8-2 kibana的index-pattern (06:27)
- 视频:8-3 kibana的discover (15:51)
- 视频:8-4 elasticsearch聚合分析-Pipeline (14:43)
- 视频:8-5 kibana的visualize基本图形-折线图 (18:17)
- 视频:8-6 kibana的visualize基本图形-热力图 (05:01)
- 视频:8-7 kibana的visualize基本图形-饼图 (04:15)
- 视频:8-8 kibana的visualize基本图形-数据图 (03:32)
- 视频:8-9 kibana的visualize基本图形-仪表盘 (03:15)
- 视频:8-10 kibana的visualize基本图形-目标图 (02:57)
- 视频:8-11 kibana的visualize的timelion (23:42)
-
第9章 2020 第九章 实时数据图表分析2 节 | 42分钟
通过对elasticsearch中存储的数据进行分析,通过kibana绘制地域分布图表分析,实时数据图表分析,短视频标签图表分析,热门背景音乐图表分析等等,同时举一反三,对租房数据,新闻资讯进行了大数据可视化分析
- 视频:9-1 短视频数据解析入库 (23:10)
- 视频:9-2 短视频数据分析项目实战 (18:16)
-
第10章 2020 第十章 课程总结1 节 | 9分钟
回顾常用的APP抓包工具的使用技巧,uiautomator2自动化抓取技巧及APP界面定位技巧 ,atxserver2多设备监控平台难点及项目中开发技巧,项目开发逻辑及项目中遇到的难点等
- 视频:10-1 课程总结 (08:11)
-
第11章 19版第一章:课程介绍1 节 | 9分钟
介绍课程目标、通过课程能学习到的内容、学会这些技能能做什么,对公司业务有哪些帮助,对个人有哪些帮助。介绍目前app数据抓取有哪些困难,面临的挑战,本实战课程会利用哪些工具来解决这些问题,以及本实战课程的特点 …
- 视频:11-1 python爬虫工程师必备技能–App数据抓取实战课程导学 (08:35)
-
第12章 19版第二章:windows下搭建开发环境9 节 | 108分钟
介绍项目开发需要安装的开发软件,讲解了安卓模拟器对比以及夜神安卓模拟器安装、介绍、简单使用和Genymotion安卓模拟器简单分析等等
- 视频:12-1 夜神模拟器安装&介绍 (09:18)
- 视频:12-2 夜神模拟器设置介绍&在夜神模拟器内部安装App (06:41)
- 视频:12-3 介绍genymotion和模拟器的安装(选择观看) (08:57)
- 视频:12-4 fiddler软件介绍&下载&安装&软件设置 (15:49)
- 视频:12-5 mitmproxy介绍&安装&如何在linux操作系统中安装 (09:59)
- 视频:12-6 mitmproxy在Linux操作系统中的使用 (12:10)
- 视频:12-7 packet capture开头,抓包工具介绍,安装,使用 (12:41)
- 视频:12-8 介绍appium环境搭建的两种方法 (18:15)
- 视频:12-9 安装docker以及docker运行ubuntu以及简单命令维护 (13:51)
-
第13章 19版第三章:爬虫必备利器、抓包工具的使用9 节 | 109分钟
本章着重介绍两款抓包工具的使用fiddler和mitmproxy。 首先介绍了fiddler抓包工具的工作界面、断点拦截、重定向、移动端设备抓包等功能 其次介绍了mitmproxy抓包工具的三个组件mitmproxy,mitmdump,mitmweb,介绍了mitmproxy工作界面、断点拦截、重定向、移动端设备抓包等功能 …
- 视频:13-1 fiddler抓包工具介绍,file&&edit功能使用 (13:20)
- 视频:13-2 tooles功能使用 (12:55)
- 视频:13-3 rules功能使用&工具栏详讲 (11:09)
- 视频:13-4 会话列表-请求头、响应头介绍 (09:39)
- 视频:13-5 请求前断点设置,响应后断点,命令行请求前后断点设置,网页重定向 (12:45)
- 视频:13-6 手机安装证书,设置fiddler抓取移动端数据包 (11:03)
- 视频:13-7 mitmproxy软件移动设备安装证书、移动设备抓包 (11:40)
- 视频:13-8 mitmproxy数据包过滤 (08:10)
- 视频:13-9 mitmdump详讲- (18:12)
-
第14章 19版第四章: App应用数据抓取入门10 节 | 85分钟
通过fiddler抓包工具分析 豆果美食app应用的数据请求接口以及app响应的数据,使用Python多线程编写爬虫抓取豆果美食app应用数据,并将数据保存到mongodb中
- 视频:14-1 、抓取前设置,启动豆果美食app并抓包1,2 (09:46)
- 视频:14-2 分析fiddler抓取的豆果美食数据包 (07:31)
- 视频:14-3 编写爬虫脚本1-项目需求、请求函数编写、请求头伪造_ (12:20)
- 视频:14-4 编写爬虫脚本2-食材页面解析、队列逻辑编写_ (09:09)
- 视频:14-5 编写爬虫脚本3-获取菜谱列表数据逻辑编写_ (12:39)
- 视频:14-6 编写爬虫脚本4-详情页数据抓取逻辑编写_ (09:58)
- 视频:14-7 编写爬虫脚本5-数据入库逻辑编写_ (07:50)
- 视频:14-8 编写爬虫脚本6-多线程逻辑编写_ (03:41)
- 视频:14-9 编写爬虫脚本7-伪装爬虫-编写代理逻辑_ (05:15)
- 视频:14-10 本章爬虫总结- (06:28)
-
第15章 19版第五章:移动端自动化控制工具详讲10 节 | 109分钟
本章讲解了:自动化工具uiautomatorviewer、appium-desktop,讲解了通过python+appium-desktop工具对安卓模拟器进行控制,编写打开手机中的app应用以及登录demo
- 视频:15-1 安装JDK环境 (08:54)
- 视频:15-2 安装sdk工具包 (06:55)
- 视频:15-3 adb工具详讲1_ (09:28)
- 视频:15-4 adb工具详讲2_ (07:09)
- 视频:15-5 adb工具详讲3_ (08:12)
- 视频:15-6 sdk下uiautomatorviewer工具使用 (09:18)
- 视频:15-7 appium介绍_ (07:23)
- 视频:15-8 inspector介绍_ (06:31)
- 视频:15-9 inspector录制功能_ (15:58)
- 视频:15-10 登陆考研帮app并实现模拟滑动操作 (28:44)
-
第16章 19版第六章:App应用数据抓取实战进阶15 节 | 216分钟
本章讲解:短视频项目应用数据抓取、通过使用fiddler抓包工具对应用数据接口进行分析,分析获取数据请求接口及构造参数等,使用python+mitmdump解析,通过编写python爬虫逻辑,appium-desktop工具控制app翻页滑动等操作,使用mitmdump对数据包进行解析,并将数据保存到mongodb中 …
- 视频:16-1 短视频抓取实战介绍_ (06:55)
- 视频:16-2 解析短视频项目分享页面数据 (09:40)
- 视频:16-3 解析短视频分享页面数据 (06:38)
- 视频:16-4 解析短视频的分享页面数据 (16:22)
- 视频:16-5 分享id存储数据库逻辑代码编写1 (07:28)
- 视频:16-6 分享id存储数据库逻辑代码编写2 (05:27)
- 视频:16-7 ssl pining技术分析与xponsed框架安装 (11:21)
- 视频:16-8 分析接口数据 (20:07)
- 视频:16-9 appium模拟滑动操作1 (22:01)
- 视频:16-10 appium模拟滑动操作2 (12:07)
- 视频:16-11 多设备端并发抓取粉丝数据 (31:39)
- 视频:16-12 视频抓取&signarure加密字段破解-1 (17:02)
- 视频:16-13 视频抓取&signarure加密字段破解-2 (21:03)
- 视频:16-14 视频抓取&signarure加密字段破解-3 (18:12)
- 视频:16-15 第六章总结 (09:07)
-
第17章 19版第七章:打造多任务端app应用数据抓取系统13 节 | 153分钟
本章介绍多任务app抓取系统架构系统的、组件、功能介绍、实现原理等,接下来讲解了在Docker中安装appium环境容器,用于模拟多个appium服务端抓取多个安卓模拟器中应用数据
- 视频:17-1 打造多任务端app应用数据抓取系统-介绍篇 (04:09)
- 视频:17-2 Docker系统管理-基础 (24:20)
- 视频:17-3 Docker系统管理-基础命令1 (16:05)
- 视频:17-4 Docker系统管理-基础命令2 (10:01)
- 视频:17-5 Docker系统管理-基础命令以及Docker-appium镜像下载_ (11:30)
- 视频:17-6 创建appium容器以及设置appium容器连接安卓模拟器-1 (14:27)
- 视频:17-7 Docker镜像创建使用Docker commit命令 (12:21)
- 视频:17-8 Docker镜像创建使用Dockerfile (13:44)
- 视频:17-9 打造多任务端app应用数据抓取系统-1 (12:48)
- 视频:17-10 打造多任务端app应用数据抓取系统-2 (13:10)
- 视频:17-11 打造多任务端app应用数据抓取系统-3_x264 (10:04)
- 视频:17-12 打造多任务端app应用数据抓取系统-4 (06:55)
- 视频:17-13 第七章小结 (02:43)
-
第18章 19版第八章:课程总结与回顾6 节 | 3分钟
课程总结与回顾:常用的APP抓包工具的使用技巧、appium desktop服务端设置及APP界面定位技巧、appium+docker多任务APP抓取系统的难点及项目中开发技巧和项目开发逻辑及项目中遇到的难点等
- 视频:18-1 第八章总结 (02:42)
- 作业:18-2 【讨论题】:爬虫的法律红线有哪些?
- 作业:18-3 eslasticsearch 的优点有哪些?
- 作业:18-4 移动端app应用数据获取工具有哪些,他们的优缺点有哪些?
- 作业:18-5 【讨论题】:APP 应用控件定位工具有哪些?
- 作业:18-6 移动端 APP 应用如何自动化操作?