数据分析从零进阶2-numpy

数据分析有很多工具,就语言上来讲,有R语言,和python。
由于我手里的课程是python的,就从python开始学起(但其实,语言本身,大同小异。并不是学习一个新技能的阻碍,纠结学什么语言,不如先学起来)。

python基础语法

这里我把一些基础语法整理成了思维导图(见文末),便于自己查找和复习。
这里其实并不是很细,因为一些api、python原生的属性、方法,完全是可以在用到的时候,去查手册的。没有必要死记硬背。

因此,在熟悉python的基础语法之后,就可以写一些小的算法题,或者开始学习一个库了。

numpy

python有很多库。这些库都是用来解决某个特定领域的某些特定问题的。

例如:Numpy是以矩阵为基础的数学计算模块,纯数学。
Scipy基于Numpy,科学计算库,有一些高阶抽象和物理模型。比方说做个傅立叶变换,这是纯数学的,用Numpy;做个滤波器,这属于信号处理模型了,在Scipy里找。
Pandas提供了一套名为DataFrame的数据结构,比较契合统计分析中的表结构,并且提供了计算接口,可用Numpy或其它方式进行计算。

也正是因为有了这些丰富的库,让我们能得以站在巨人的肩膀上,不用纠结某一块很细节的事务是怎么处理的,而只用关心业务就好(一些的库都是如此,看看npm)。

关于numpy和python基础语法,这里整理了一份思维导图(主要是按极客时间上陈旸老师的数据分析课程整理)。

https://mubu.com/doc/zgxb309Pv-
幕布,是一个国产的,和workflowy一样的“条目”式的全平台思维导图。

此外,还可以在科赛网进行numpy、pandas等python数据分析库的学习。这里提供了一些基础库的学习教程,fork一下,就可以用科赛网提供的在线环境学习了。此外,还会有一些竞赛,学习到达一定程度,就可以参加竞赛来检验自己的学习水平。

https://www.kesci.com/home/project/5a0575cd60680b295c1ecff2
科赛网还提供了免费的jupyter notebook环境,可以对代码进行快速调试。