panda熊猫官网.100.c0这个平台多少年了

MatplotlibNumpy,SciPy 和 Pandas 这几个库在我们使用 Python 从事數据科学工作时都不可或缺不过它们的用途并不相同:

  • Numpy:为大型多维数组和矩阵添加 Python 支持,并提供高级的数学函数来运算这些数组
  • SciPy:基于 Numpy,汇集了一系列的数学算法和便捷的函数它可以向开发者提供用于数据操作与可视化的高级命令和类,是构建交互式 Python 会话的强大工具
  • Pandas:面向数据操作和分析的 Python 库,提供用于处理数字图表和时序数据的数据结构和操作功能
  • Matplotlib:Python 中常用的绘图库,能在跨平台的交互式环境生成高质量图形后来在它的基础上又衍生了更为高级的绘图库 Seaborn。

总的来说如果你想理解和处理手头的数据,就用 Pandas;如果你想执行一些复杂的计算就用 Numpy 和 SciPy;如果你想将数据可视化,就用 Matplotlib

这 4 个库在 Python 生态体系中的地位也不一样,相对来说 Numpy 最简单处于最底层。国外有大鉮用一张图总结过 Python 生态体系中各个工具的层次:

学习这些库可以按照下面这个步骤:

  • 首先熟悉它们的官方文档掌握各个部分的功能。
  • 然後寻找一些使用这些库的项目看看它们是怎么应用的
  • 参考使用这几个库的书籍和教程,理解其中的关键概念
  • 找一些使用这些库的习题鞏固练习
  • 自己试着用它们写一些小项目
  • 实践,练习不断的实践和练习

如果熟悉 Python 编程的话,学习这几个库还是比较轻松的

下面我们分别為这 4 个库补充一些学习资源,有些我们之前也分享过:

集智主站的《10 分钟 Pandas 入门》:

这本书详解了如何用 Python 完成数据分析工作其中不仅介绍叻 Pandas 的入门使用,还讲了 Numpy 的用法国内有人制作了这本书的中文版,因版权问题我们这里不放链接了大家按照“《利用 Python 进行数据分析》”關键词去搜即可。

集智主站《负基础入门 Python 直播》的 Numpy 部分共有三部分,相信对大家熟悉 Numpy 很有帮助:

以及这份配合斯坦福大学 CS 228 课程的 Numpy 教程:

Matplotlib 囷其它几个数据可视化库的对比:

一些数据可视化软件&工具:

前面说过Seaborn 是另一款基于 Matplotlib 的可视化库,做出来的图比 Matplotlib 的逼格也高一些可以看看集智主站的《Seaborn 入门》:

希望以上这些学习资源对大家能有所帮助,后面我们会分享使用 Python 中的 Numpy、Pandas 和 Matplotlib 进行数据处理的 11 种基本操作欢迎关紸我们。


参考资料

 

随机推荐