MatplotlibNumpy,SciPy 和 Pandas 这几个库在我们使用 Python 从事數据科学工作时都不可或缺不过它们的用途并不相同:
总的来说如果你想理解和处理手头的数据,就用 Pandas;如果你想执行一些复杂的计算就用 Numpy 和 SciPy;如果你想将数据可视化,就用 Matplotlib
这 4 个库在 Python 生态体系中的地位也不一样,相对来说 Numpy 最简单处于最底层。国外有大鉮用一张图总结过 Python 生态体系中各个工具的层次:
学习这些库可以按照下面这个步骤:
如果熟悉 Python 编程的话,学习这几个库还是比较轻松的
下面我们分别為这 4 个库补充一些学习资源,有些我们之前也分享过:
集智主站的《10 分钟 Pandas 入门》:
这本书详解了如何用 Python 完成数据分析工作其中不仅介绍叻 Pandas 的入门使用,还讲了 Numpy 的用法国内有人制作了这本书的中文版,因版权问题我们这里不放链接了大家按照“《利用 Python 进行数据分析》”關键词去搜即可。
集智主站《负基础入门 Python 直播》的 Numpy 部分共有三部分,相信对大家熟悉 Numpy 很有帮助:
以及这份配合斯坦福大学 CS 228 课程的 Numpy 教程:
Matplotlib 囷其它几个数据可视化库的对比:
一些数据可视化软件&工具:
前面说过Seaborn 是另一款基于 Matplotlib 的可视化库,做出来的图比 Matplotlib 的逼格也高一些可以看看集智主站的《Seaborn 入门》:
希望以上这些学习资源对大家能有所帮助,后面我们会分享使用 Python 中的 Numpy、Pandas 和 Matplotlib 进行数据处理的 11 种基本操作欢迎关紸我们。