Python数据分析入门与实践
掌握数据处理、分析、展示的能力,开启Data Science职业之旅
这是一个数据驱动的时代,本课程通过Numpy、Pandas进行数据科学计算,通过Seaborn、 Matplotlib进行数据图形化展示;从实战角度出发,让你在数据科学领域迈出重要的一步,开启Data Science职业之旅!
适合人群及技术储备要求
只要具备基本的Python语法,对数据科学感兴趣的人都可以学习本课程,
这是一门真正入门课程,但并不止步于入门将带你从入门向进阶过渡,
带你迈进Python data science领域!
学前必备技术
Python语法基础丨高中数学知识
[wm_notice]试看链接:https://pan.baidu.com/s/1a-aJDT0vxJ_BjskAFFG83A
提取码:k46p
–来自百度网盘超级会员V1的分享[/wm_notice]
章节目录:
-
第1章 实验环境的搭建6 节 | 52分钟
本章将主要介绍Anaconda和Jupyter Notebook。包括如何在windows,Mac,linux等平台上安装Anaconda,以及Jupyter Notebook的基本启动使用方法。
- 视频:1-1 导学视频 (08:36)
- 视频:1-2 Anaconda和Jupyter notebook介绍 (12:11)
- 视频:1-3 Anaconda在Mac上的安装演示 (06:57)
- 视频:1-4 Anaconda在windows上安装演示 (05:09)
- 视频:1-5 Anaconda在Linux上的安装演示 (09:52)
- 视频:1-6 Jupyter-notebook的使用演示 (08:43)
-
第2章 Numpy入门 试看5 节 | 40分钟
本章将介绍Python数据科学领域里最基础的一个库——Numpy,回顾矩阵运算基础,介绍最重要的数据结构Array以及如何通过Numpy进行数组和矩阵运算。
- 视频:2-1 数据科学领域5个常用Python库 (06:08)试看
- 视频:2-2 数学基础回顾之矩阵运算 (06:07)试看
- 视频:2-3 Array的创建及访问 (10:44)试看
- 视频:2-4 数组与矩阵运算 (10:49)
- 视频:2-5 Array的input和output (05:39)
-
第3章 Pandas入门9 节 | 96分钟
本章将介绍Python数据科学领域用于数据分析最重要的一个库——Pandas。将从pandas里最重要的两种数据结构Series和DataFrame开始,介绍其创建和基本操作,通过实际操作理解Series和DataFrame的关系。
- 视频:3-1 Pandas Series (08:32)
- 视频:3-2 Pandas DataFrame (09:34)
- 视频:3-3 深入理解Series和Dataframe (11:30)
- 视频:3-4 Pandas-Dataframe-IO操作 (08:53)
- 视频:3-5 DataFrame的Selecting和indexing (13:43)
- 视频:3-6 Series和Dataframe的Reindexing (11:03)
- 视频:3-7 谈一谈NaN (11:15)
- 视频:3-8 多级Index (11:29)
- 视频:3-9 Mapping和Replace (09:12)
-
第4章 Pandas玩转数据15 节 | 176分钟
本章是Pandas的进阶。我们会使用Pandas进行高级的数据分析操作,包括如何去做数据清洗、预处理和排序等数学计算,数据的分箱技术,分组技术,聚合技术,以及透视表等。
- 视频:4-1 DataFrame的简单数学计算 (08:44)
- 视频:4-2 Series和DataFrame的排序 (09:17)
- 视频:4-3 重命名Dataframe的index (15:22)
- 视频:4-4 DataFrame的merge操作 (10:09)
- 视频:4-5 Concatenate和Combine (11:58)
- 视频:4-6 通过apply进行数据预处理 (10:33)
- 视频:4-7 通过去重进行数据清洗 (07:18)
- 视频:4-8 时间序列操作基础 (13:01)
- 视频:4-9 时间序列数据的采样和画图 (14:33)
- 视频:4-10 数据分箱技术Binning (09:22)
- 视频:4-11 数据分组技术GroupBy (12:35)
- 视频:4-12 数据聚合技术Aggregation (07:27)
- 视频:4-13 透视表 (13:52)
- 视频:4-14 分组和透视功能实战 (22:01)
- 视频:4-15 Streaming DataFrame (09:20)
-
第5章 绘图和可视化之Matplotlib6 节 | 69分钟
数据的可视化是数据分析领域里非常重要的内容。本章会学习Matplotlib的基本使用,包括如何对Pandas里的Series和DataFrame绘图, 以及图形样式和显示模式的设置等内容。
- 视频:5-1 Matplotlib介绍 (09:46)
- 视频:5-2 matplotlib简单绘图之plot (15:27)
- 视频:5-3 matplotlib简单绘图之subplot (12:59)
- 视频:5-4 Pandas绘图之Series (09:32)
- 视频:5-5 Pandas绘图之DataFrame (10:15)
- 视频:5-6 直方图和密度图 (10:36)
-
第6章 绘图和可视化之Seaborn5 节 | 62分钟
Seaborn是对Matplotlib的进一步封装,其强大的调色功能和内置的多种多样的绘图模式,使之成为当下最流行的数据科学绘图工具。本章将介绍Seaborn的基本使用,以及和matplotlib的功能对比。
- 视频:6-1 seaborn介绍 (08:22)
- 视频:6-2 seaborn实现直方图和密度图 (08:28)
- 视频:6-3 seaborn实现柱状图和热力图 (12:52)
- 视频:6-4 seaborn图形显示效果的设置 (15:22)
- 视频:6-5 seaborn强大的调色功能 (16:27)
-
第7章 数据分析项目实战4 节 | 43分钟
通过前六章的学习,我们基本上掌握了数据分析领域里主要工具的使用,本章将通过一个股票市场的分析实战项目,和大家一起用学过的知识去分析数据,进而得到有用的信息。
- 视频:7-1 实战准备 (05:30)
- 视频:7-2 股票市场分析实战之数据获取 (07:01)
- 视频:7-3 股票市场分析实战之历史趋势分析 (14:01)
- 视频:7-4 股票市场分析实战之风险分析 (15:36)