安装各种python库总是出错，每次报错，找各种教程好耽误时间，怎么办？

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>编程 >>安装各种python库总是出错，每次报错，找各种教程好耽误时间，怎么办？

安装各种python库总是出错，每次报错，找各种教程好耽误时间，怎么办？

来源：蜘蛛抓取(WebSpider) 时间：2022-05-21 04:10 标签： python安装失败的解决办法

站长简介:高级工程师,爱好交友,无偿辅导python和前端,技术交流,面试指导,找工作指导,瞎聊都可加我微信i88811i哈,欢迎欢迎!也欢迎加入程序员交流群,专属程序员的圈子,加我微信拉你进群
欢迎关注我的公众号:程序员总部,关注公众号回复python,免费领取,关注公众号回复充值+你的账号,免费为您充值1000积分

所属网站分类: 技术文章 >

Python是一种编程语言，包含对象，模块，线程，异常和自动内存管理。Python的好处在于它简单易用，可移植，可扩展，内置数据结构，并且它是一个开源的。

PEP 8是一个编码约定，关于如何编写Python代码更具可读性。

3）什么是序列化和非序列化？

Pickle模块接受任何Python对象并将其转换为字符串表示形式，并使用dump函数将其转储到文件中，此过程称为pickling。从存储的字符串表示中检索原始Python对象的过程称为unpickling。

Python语言是一种解释语言。Python程序直接从源代码运行。它将程序员编写的源代码转换为中间语言，再次转换为必须执行的机器语言。

5）如何在Python中内存管理？

Python内存由Python私有堆空间管理。所有Python对象和数据结构都位于私有堆中。程序员无权访问此私有堆，解释器负责处理此私有堆。
Python对象的Python堆空间分配由Python内存管理器完成。核心API提供了一些程序员编写代码的工具。
Python还有一个内置的垃圾收集器，它可以回收所有未使用的内存并释放内存并使其可用于堆空间。

6）有哪些工具可以帮助查找错误或执行静态分析？

PyChecker是一个静态分析工具，可以检测Python源代码中的错误，并警告错误的风格和复杂性。Pylint是另一种验证模块是否符合编码标准的工具。

Python decorators是我们在Python语法中进行的一项特定更改，可以轻松地更改函数。

列表和元组之间的区别在于列表是可变的而元组不是。元组可以被散列，例如作为词典的关键。

9）参数如何通过值或引用传递？

Python中的所有内容都是一个对象，所有变量都包含对象的引用。参考值是根据功能; 因此，您无法更改引用的值。但是，如果对象是可变的，则可以更改它们。

11）python提供的内置类型是什么？

有可变和不可变类型的Pythons，内置类型为Mutable内置类型

12）Python中的命名空间是什么？

在Python中，引入的每个名称都有一个存在的地方，可以被连接起来。这称为命名空间。它就像一个框，其中变量名称映射到放置的对象。每当搜索到变量时，将搜索此框以获取相应的对象。

它是一个单独的表达式匿名函数，通常用作内联函数。

python中的lambda表单没有语句，因为它用于创建新的函数对象，然后在运行时返回它们。

pass意味着，无操作的Python语句，或者换句话说，它是复合语句中的占位符，其中应该留有空白，并且不必在那里写入任何内容。

16）什么是Python中的迭代器？

在Python中，迭代器用于迭代一组元素，如列表之类的容器。

17）什么是Python中的单元测试？

Python中的单元测试框架称为unittest。它支持共享设置，自动化测试，测试关闭代码，将测试聚合到集合等。

18）在Python中切片是什么？

从序列类型（如列表，元组，字符串等）中选择一系列项目的机制称为切片。

19）Python中的生成器是什么？

实现迭代器的方法称为生成器。这是一个正常的函数，除了它在函数中产生表达式。

Python文档字符串称为docstring，它是一种记录Python函数，模块和类的方法。

21）如何在Python中复制对象？

要在Python中复制对象，可以尝试copy.copy（）或copy.deepcopy（）来处理一般情况。您无法复制所有对象，但大多数对象都是如此。

22）Python中的反向索引是什么？

Python序列可以是正数和负数的索引。对于正索引，0是第一个索引，1是第二个索引，依此类推。对于负索引，（ - 1）是最后一个索引，（ - 2）是倒数第二个索引，依此类推。

23）如何将数字转换为字符串？

要将数字转换为字符串，请使用内置函数str（）。如果需要八进制或十六进制表示，请使用内置函数oct（）或hex（）。

Xrange返回xrange对象，而range返回列表，并使用相同的内存，无论范围大小是多少。

在Python中，模块是构造程序的方式。每个Python程序文件都是一个模块，它导入其他模块，如对象和属性。

Python程序的文件夹是一个模块包。包可以包含模块或子文件夹。

26）提到Python中局部变量和全局变量的规则是什么？

局部变量：如果在函数体内的任何位置为变量赋值，则假定它是本地的。

全局变量：仅在函数内引用的那些变量是隐式全局变量。

27）如何跨模块共享全局变量？

要在单个程序中跨模块共享全局变量，请创建一个特殊模块。在应用程序的所有模块中导入配置模块。该模块将作为跨模块的全局变量提供。

要在Unix上使Python脚本可执行，您需要做两件事，

脚本文件的模式必须是可执行的

29）解释如何在Python中删除文件？

30）解释如何在Python中生成随机数？

要在Python中生成随机数，您需要将命令导入为：

这将返回[0,1）范围内的随机浮点数。

31）解释如何从C访问用Python编写的模块？

您可以通过以下方法访问C中用Python编写的模块，

32）提到在Python中使用//运算符？

33）使用Python的五大好处？

Python包含一个巨大的标准库，适用于大多数Internet平台，如电子邮件，HTML等。
Python不需要显式内存管理，因为解释器本身会将内存分配给新变量并自动释放它们
由于使用方括号，因此易于阅读
拥有内置数据类型可以节省编程时间和工作量，从而声明变量

在Python中使用split函数是使用定义的分隔符将字符串分解为更短的字符串。它给出了字符串中存在的所有单词的列表。

35）解释什么是Flask及其好处？

Flask是微框架的一部分。这意味着它对外部库几乎没有依赖性。它使框架变得轻盈，同时几乎没有更新的依赖性和更少的安全性错误。

Flask是一个“微框架”，主要用于具有更简单要求的小型应用程序。在Flask中，您必须使用外部库。

Pyramid是为更大的应用程序构建的。它提供了灵活性，并允许开发人员为他们的项目使用正确的工具。开发人员可以选择数据库，URL结构，模板样式等。Pyramid是可配置的。

像Pyramid一样，Django也可以用于更大的应用程序。它包括一个ORM。

37）什么是Flask-WTF以及它们的特征是什么？

38）解释Flask脚本工作的常用方法是什么？

Flask脚本工作的常用方法是：

或者是Python文件的路径

39）解释如何在Flask中访问会话？

会话基本上允许您记住从一个请求到另一个请求的信息。在一个Flask中，它使用签名cookie，以便用户可以查看会话内容并进行修改。如果只有密钥Flask.secret_key，则用户可以修改会话。

40）Flask是MVC模型，如果是，举例说明你的应用程序的MVC模式？

基本上，Flask是一个简约框架，其行为与MVC框架相同。所以MVC非常适合Flask，MVC的模式我们将考虑以下示例。

Python学习教程：如何正确使用Pandas库提升项目的运行速度？

如果你从事大数据工作，用Python的Pandas库时会发现很多惊喜。Pandas在数据科学和分析领域扮演越来越重要的角色，尤其是对于从Excel和VBA转向Python的用户。

所以，对于数据科学家，数据分析师，数据工程师，Pandas是什么呢？Pandas文档里的对它的介绍是：

“快速、灵活、和易于理解的数据结构，以此让处理关系型数据和带有标签的数据时更简单直观。”

快速、灵活、简单和直观，这些都是很好的特性。当你构建复杂的数据模型时，不需要再花大量的开发时间在等待数据处理的任务上了。这样可以将更多的精力集中去理解数据。

但是，有人说Pandas慢…

第一次使用Pandas时，有人评论说：Pandas是很棒的解析数据的工具，但是Pandas太慢了，无法用于统计建模。第一次使用的时候，确实如此，真的慢。

但是，Pandas是建立在NumPy数组结构之上的。所以它的很多操作通过NumPy或者Pandas自带的扩展模块编写，这些模块用Cython编写并编译到C，并且在C上执行。因此，Pandas不也应该很快的吗？

事实上，使用姿势正确的话，Pandas确实很快。

在使用Pandas时，使用纯“python”式代码并不是最效率的选择。和NumPy一样，Pandas专为向量化操作而设计，它可在一次扫描中完成对整列或者数据集的操作。而单独处理每个单元格或某一行这种遍历的行为，应该作为备用选择。

跟大家说明一下，本Python学习教程不是引导如何过度优化Pandas代码。因为Pandas在正确的使用下已经很快了。此外，优化代码和编写清晰的代码之间的差异是巨大的。

这是一篇关于“如何充分利用Pandas内置的强大且易于上手的特性”的指引。此外，你将学习到一些实用的节省时间的技巧。在这篇Python学习教程中，你将学习到：

· 使用datetime时间序列数据的优势

· 处理批量计算更效率的方法

这篇文章，耗电量时间序列数据将被用于演示本主题。加载数据后，我们将逐步了解更有效率的方法取得最终结果。对于Pandas用户而言，会有多种方法预处理数据。但是这不意味着所有方法都适用于更大、更复杂的数据集。

本例使用能源消耗的时间序列数据计算一年能源的总成本。由于不同时间段的电价不同，因此需要将各时段的耗电量乘上对应时段的电价。

从CSV文件中可以读取到两列数据：日期时间和电力消耗（千瓦）

每行数据中都包含每小时耗电量数据，因此整年会产生8760（356×24）行数据。每行的小时数据表示计算的开始时间，因此1/1/13 0：00的数据指1月1号第1个小时的耗电量数据。

首先用Pandas的一个I/O函数读取CSV文件：

这结果看上去挺好，但是有个小问题。Pandas 和NumPy有个数据类型dtypes概念。假如不指定参数的话，date_time这列将会被归为默认类object：

默认类object不仅是str类的容器，而且不能齐整的适用于某一种数据类型。字符串str类型的日期在数据处理中是非常低效的，同时内存效率也是低下的。

为了处理时间序列数据，需要将date_time列格式化为datetime类的数组，Pandas 称这种数据类型为时间戳Timestamp。用Pandas进行格式化相当简单：

至此，新的df和CSV file内容基本一样。它有两列和一个索引。

上述代码简单且易懂，但是有执行速度如何呢？这里我们使用了timing装饰器，这里将装饰器称为@timeit。这个装饰器模仿了Python标准库中的timeit.repeat() 方法，但是它可以返回函数的结果，并且打印多次重复调试的平均运行时间。Python的timeit.repeat() 只返回调试时间结果，但不返回函数结果。

将装饰器@timeit放在函数上方，每次运行函数时可以同时打印该函数的运行时间。

看结果如何？处理8760行数据耗时1.6秒。这似乎没啥毛病。但是当处理更大的数据集时，比如计算更高频的电费数据，给出每分钟的电费数据去计算一整年的总成本。数据量会比现在多60倍，这意味着你需要大约90秒去等待输出的结果。这就有点忍不了了。

实际上，作者工作中需要分析330个站点过去10年的每小时电力数据。按上边的方法，需要88分钟完成时间列的格式化转换。

有更快的方法吗？一般来说，Pandas可以更快的转换你的数据。在本例中，使用格式参数将csv文件中特定的时间格式传入Pandas的to_datetime中，可以大幅的提升处理效率。

新的结果如何？0.032秒，速度提升了50倍！所以之前330站点的数据处理时间节省了86分钟。

一个需要注意的细节是CSV中的时间格式不是ISO 8601格式：YYYY-mm-dd HH：MM。如果没有指定格式，Pandas将使用dateuil包将每个字符串格式的日期格式化。相反，如果原始的时间格式已经是ISO 8601格式了，Pandas可以快速的解析日期。

日期时间已经完成格式化，现在准备开始计算电费了。由于每个时段的电价不同，因此需要将对应的电价映射到各个时段。此例中，电价收费标准如下：

如果电价全天统一价28美分每千瓦每小时，大多数人都知道可以一行代码实现电费的计算：

这行代码将创建一行新列，该列包含当前时段的电费：

但是电费的计算取决于不用的时段对应的电价。这里许多人会用非Pandas式的方式：用遍历去完成这类计算。

在本文中，将从最基础的解决方案开始介绍，并逐步提供充分利用Pandas性能优势的Python式解决方案。

但是对于Pandas库来说，什么是Python式方案？这里是指相比其他友好性较差的语言如C++或者Java，它们已经习惯了“运用遍历”去编程。

如果不熟悉Pandas，大多数人会像以前一样使用继续遍历方法。这里继续使用@timeit装饰器来看看这种方法的效率。

首先，创建一个不同时段电价的函数：

如下代码就是一种常见的遍历模式：

对于没有用过Pandas的Python用户来说，这种遍历很正常：对于每个x，再给定条件y下，输出z。

但是这种遍历很笨重。可以将上述例子视为Pandas用法的“反面案例”，原因如下几个。

首先，它需要初始化一个列表用于存储输出结果。

其次，它用了隐晦难懂的类range(0, len(df))去做循环，接着在应用apply_tariff()函数后，还必须将结果增加到列表中用于生成新的DataFrame列。

这种遍历方式最大的问题在于计算的时间成本。对于8760行数据，花了3秒钟完成遍历。下面，来看看一些基于Pandas数据结构的迭代方案。

取得一些不错的进步。语法更清晰，少了行值i的引用，整体更具有可读性了。在时间收益方面，几乎快了5倍！

但是，仍然有很大的改进空间。由于仍然在使用for遍历，意味着每循环一次都需要调用一次函数，而这些本可以在速度更快的Pandas内置架构中完成。

.apply()的语法优势很明显，代码行数少了，同时代码也更易读了。运行速度方面，这与.iterrows()方法相比节省了大约一半时间。

但是，这还不够快。一个原因是.apply()内部尝试在Cython迭代器上完成循环。但是在这种情况下，lambda中传递了一些无法在Cython中处理的输入，因此调用.apply()时仍然不够快。

如果使用.apply()在330个站点的10年数据上，这大概得花15分钟的处理时间。假如这个计算仅仅是一个大型模型的一小部分，那么还需要更多的提升。下面的向量化操作可以做到这点。

之前看到的如果只有单一电价，可以将所有电力消耗数据乘以该价格df['energy_kwh'] * 28。这种操作就是一种向量化操作的一个用例，这是Pandas中最快的方式。

但是，在Pandas中如何将有条件的计算应用在向量化操作中呢？一种方法是，根据条件将DataFrame进行筛选并分组和切片，然后对每组数据进行对应的向量化操作。

在下面的例子中，将展示如何使用Pandas中的.isin()方法筛选行，然后用向量化操作计算对应的电费。在此操作前，将date_time列设置为DataFrame索引便于向量化操作：

# 定义每个时段的布尔型数组(Boolean)

# 计算不同时段的电费

要理解这段代码，也许需要先了解.isin()方法返回的是布尔值，如下：

这些布尔值标记了DataFrame日期时间索引所在的时段。然后，将这些布尔值数组传给DataFrame的.loc索引器时，会返回一个仅包含该时段的DataFrame切片。最后，将该切片数组乘以对应的时段的费率即可。

这与之前的遍历方法相比如何？

首先，不需要apply_tariff()函数了，因为所有的条件逻辑都被应用在了被选中的行。这大大减少了代码的行数。

在速度方面，比普通的遍历快了315倍，比.iterrows()方法快了71倍，且比.apply()方法快了27倍。现在可以快速的处理大数据集了。

pd.cut()根据分组bins产生的区间生成对应的标签“费率”。

【注】include_lowest参数设定第一个间隔是否包含在组bins中，例如想要在该组中包含时间在0时点的数据。

这是种完全向量化的操作，它的执行速度已经起飞了：

至此，现在可以将330个站点的数据处理时间从88分钟缩小到只需不到1秒。但是，还有最后一个选择，就是使用NumPy库来操作DataFrame下的每个NumPy数组，然后将处理结果集成回DataFrame数据结构中。

别忘了Pandas的Series和DataFrame是在NumPy库的基础上设计的。这提供了更多的灵活性，因为Pandas和NumPy数组可以无缝操作。

在下一例中，将演示NumPy的digitize()功能。它和Pandas的cut()功能类似，将数据分组。本例中将DataFrame中的索引（日期时间）进行分组，将三个时段分入三组。然后将分组后的电力消耗数组应用在电价数组上：

和cut()一样，语法简单易读。但是速度如何呢？

执行速度上，仍然有提升，但是这种提升已经意义不大了。不如将更多精力去思考其他的事情。

Pandas可以提供很多批量处理数据方法的备用选项，这些已经在上边都一一演示过了。这里将最快到最慢的方法排序如下：

1. 使用向量化操作：没有for遍历的Pandas方法和函数。

4. 使用.iterrows()：将DataFrame行作为（index，pd.Series）元组数组进行迭代。虽然Pandas的Series是一种灵活的数据结构，但将每一行生成一个Series并且访问它，仍然是一个比较大的开销。

5. 对逐个元素进行循环，使用df.loc或者df.iloc对每个单元格或者行进行处理。

【注】以上顺序不是我的建议，而是Pandas核心开发人员给的建议。

以下是本文中所有函数的调试时间汇总：

已经了解了用Pandas快速处理数据，现在我们需要探讨如何避免重复的数据处理过程。这里使用了Pandas内置的HDFStore方法。

通常在建立一些复杂的数据模型时，对数据做一些预处理是很常见的。例如，假如有10年时间跨度的分钟级的高频数据，但是模型只需要20分钟频次的数据或者其他低频次数据。你不希望每次测试分析模型时都需要预处理数据。

一种方案是，将已经完成预处理的数据存储在已处理数据表中，方便需要时随时调用。但是如何以正确的格式存储数据？如果将预处理数据另存为CSV，那么会丢失datetime类，再次读入时必须重新转换格式。

Pandas有个内置的解决方案，它使用HDF5，这是一种专门用于存储数组的高性能存储格式。Pandas的HDFstore方法可以将DataFrame存储在HDF5文件中，可以有效读写，同时仍然保留DataFrame各列的数据类型和其他元数据。它是一个类似字典的类，因此可以像Python中的dict类一样读写。

以下是将已经预处理的耗电量DataFrame写入HDF5文件的方法：

将数据存储在硬盘以后，可以随时随地调取预处理数据，不再需要重复加工。以下是关于如何从HDF5文件中访问数据的方法，同时保留了数据预处理时的数据类型：

一个数据仓库可以存储多张表，每张表配有一个键。

如果觉得你的Pandas项目不具备速度快、灵活、简单且直观的特征，那么该重新思考使用该库的方式了。

本次的Python学习教程已经相当直观的展示了正确的使用Pandas是可以大幅改善运行时间，以及代码可读性的。以下是应用Pandas的一些经验性的建议：

① 尝试更多的向量化操作，尽量避免类似for x in df的操作。如果代码中本身就有许多for循环，那么尽量使用Python自带的数据结构，因为Pandas会带来很多开销。

② 如果因为算法复杂无法使用向量化操作，可以尝试.apply()方法。

③ 如果必须循环遍历数组，可用.iterrows()或者.itertuples()改进语法和提升速度。

④ Pandas有很多可选项操作，总有几种方法可以完成从A到B的过程，比较不同方法的执行方式，选择最适合项目的一种。

⑤ 做好数据处理脚本后，可以将中间输出的预处理数据保存在HDFStore中，避免重新处理数据。

⑥ 在Pandas项目中，利用NumPy可以提高速度同时简化语法。

安装各种python库总是出错，每次报错，找各种教程好耽误时间，怎么办？

我要回帖

更多关于 python安装失败的解决办法的文章

随机推荐

安装各种python库总是出错，每次报错，找各种教程好耽误时间，怎么办？

我要回帖

更多关于 python安装失败的解决办法 的文章

随机推荐

更多关于 python安装失败的解决办法的文章