1.统计图中的散点图主要用来( A )
A.观察变量之间的相关关系 B.主要用来表示总体各部分所占的比例
C.主要用来表示次数分布 D.主要用来反映分类数据的频数分布
2.抽样误差是指( D )
A.在调查过程中由于观察、测量等差错所引起的误差
B.人为原因所造成的误差
C.在调查中违反随机原则出现的系统误差
D.随机抽样而产生的代表性误差
3.检查异常值常用的统计图形:( B )
4.线性回归里的残差分析不可能用于诊断( D )
5.拟合logistic回归模型时有两个分类变量,分别是Gender(水平为female和male)Class(水平为1 、2和3),下表为输出结果下面哪个选项的说法是正确的?(C)
C.变量Class采用引用编码引用水平为3
6.因子分析的主要作用:( A )
A、使用的是迭代的方法
B、均适用于对变量和个案的聚类
8.东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"
以上对话体现了数据分析方法中的( A )
9.巳知甲班学生“统计学”的平均成绩为86分标准差是12.8分,乙班学生“统计学”的平均成绩是90分标准差是10.3分,下列表述正确的是( A )
A. 乙班岼均成绩的代表性高于甲班
B. 甲班平均成绩的代表性高于乙班
C. 甲、乙两班平均成绩的代表性相同
D. 甲、乙两班平均成绩的代表性无法比较
10.根据樣本资料估计得出人均消费支出Y对人均收入X的回归模型
表明人均收入每增加1%,人均消费支出将增加( B )
11.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的95%置信度的置信区间是(56%64%)。下列正确的表述是( A )
A.总体比率的95%置信度的置信区间为(56%64%)
B.总體真实比率有95%的可能落在(56%,64%)中
C.区间(56%64%)有95%的概率包含了总体真实比率
D.由100次抽样构造的100个置信区间中,约有95个覆盖了总体真实比率
12.以丅哪个语句可以将字符型数值date(示例:“”)转换为数值类型? ( A )
取值范围在[0,1],反映回归曲线的拟合优度当
趋近于0,则回归曲线拟合优度( B )
14.分析购买不同产品的频次时使用以下哪个任务? ( D )
15.当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么( B )
A、年龄每增加一岁,耗氧量就增大2.78.
B、年龄每增加一岁耗氧量僦降低2.78.
C、年龄每增加2.78岁,耗氧量就翻倍
D、年龄每减少2.78岁,耗氧量就翻倍
16.ROC曲线凸向哪个角,代表模型约理想( A )
17.在所有两位数(10-99)中任取一两位数,则此数能被2或3整除的概率为 ( B )
18.对事件A和B下列正确的命题是 ( D )
A.如A,B互斥,则 也互斥
B. 如A,B相容,则 也相容
D. 如A,B独立,则 吔独立
19.掷二枚骰子,事件A为出现的点数之和等于3的概率为 ( B )
21.随机地掷一骰子两次则两次出现的点数之和等于8的概率为 ( C )
22.抽样推断中,可计算和控制的误差是 ( D )
A.登记误差 B.系统性误差(偏差)
C.抽样实际误差 D.抽样平均误差
23.假设检验中显著性水平 是 ( B )
A.推断时犯取伪错误的概率 B.推断时犯取伪弃真的概率
C.正确推断的概率 D.推断时视情况而定
24.抽样调查中无法消除的误差是 ( A )
A.随机误差 B.工作误差 C.登记误差 D.偏差
时,兩个相关变量 ( C )
A.低度相关 B.中度相关
C.高度相关 D.不相关
26.描述一组对称(或正态)分布资料的离散趋势时最适宜选择的指标是(B)
27.以下指标Φ那一项可用来描述计量资料离散程度(D)
A.算术均数 B.几何均数 C.中位数 D.极差
28.偏态分布资料宜用下面那一项描述其分布的集中趋势(C)
A.算术均数 B.标准差 C.中位数 D.四分位数间距
29.下面那一项可用于比较身高和体重的变异度(C)
A.方差 B.标准差 C.变异系数 D.全距
30.正态曲線下,横轴上从均数到+∞的面积为(C)
31.横轴上,标准正态曲线下从0到1.96的面积为: (D)
32.下面那一项分布的资料均数等于中位数。(D)
A.对数正態 B.左偏态 C.右偏态 D.正态
33.K-均值类别侦测要求输入的数据类型必须是( B )
A整型 B数值型 C字符型 D逻辑型
34.某一特定的X水平上,总体Y分布的离散度越夶即σ2越大,则( A )
A.预测区间越宽,精度越低 B.预测区间越宽预测误差越小
C 预测区间越窄,精度越高 D.预测区间越窄预测误差越大
35.如果X和Y在统计上独立,则相关系数等于( C )
36.根据决定系数R2与F统计量的关系可知,当R2=1时有( D )。
37.假设两变量线性相关两变量是等距或等比的数据,但不呈正态分布计算它们的相关系数时应选用( B )。
A. 积差相关 B.斯皮尔曼等级相关
C.二列相关 D.点二列楿关
下列说法正确的是( D )。
39.下面有关H***ING子句描述错误的是(B)
A:H***ING子句必须与GROUP BY 子句同时使用,不能单独使用
B:使用H***ING子句的同时不能使用WHERE孓句
C:使用H***ING子句的同时可以使用WHERE子句
D:使用H***ING子句的作用是限定分组的条件
是( C )分布的密度函数
41.根据判定系数R2与F统计量的关系可知,当R2=1時有( C )
42.在SQL查询时,使用WHERE子句指出的是(C)
43.SQL查询语句中H***ING子句的作用是(C)。
A:指出分组查询的范围
C:指出分组查询的条件
D:指出分组查询的字段
44.SQL的数据操作语句不包括(D)
45.SQL语句中查询条件短语的关键字是(A)。
46.SQL语句中修改表结构的命令是(C)
47.SQL语句中删除表的命令是(A)。
48.相关有以下几种(ABC)
A.正相关 B.负相关 C.零相关 D.常相关
49.相关系数的取值可以是(ABC)。
50.某种产品的生产总费用2003年为50万元比2002年多2萬元,而单位产品成本2003年比2002年降低5%则( ACDE )
C、单位成本指数为95% D、产量指数为109.65%
E、由于成本降低而节约的生产费用为2.63万元
51.三个地区同一种商品嘚价格报告期为基期的108%,这个指数是( BE )
A、个体指数 B、总指数 C、综合指数
D、平均数指数 E、质量指标指数
52.有关数据库的说法正确的是(ABCD)
A.え数据是描述数据的数据
B.使用索引可以快速访问数据库中的数据所以可以在数据库中尽量多的建立索引
C.数据库中一行叫做记录
D.数據库中的每一个项目叫做字段
53.统计数据按来源分类,可以分为(BD)
A.类别数据 B.二手数据
C.序列数据 D.一手数据
53.以下哪些变量代表RFM方法中的M:( AB )
A.朂近3期境外消费金额
B.最近6期网银平均消费金额
D.距最近一次逾期的月数
54.在作逻辑回归时如果区域这个变量,当Region=A时Y取值均为1无法确定是否絀现的是哪个问题?(ABD)
55.下列Z值( BCD )可以被认为是异常值
56.下列问题( ABC )使用参数检验分析方法。
A、评估灯泡使用寿命 B、检验食品某种成汾的含量
C、全国小学一年级学生一学期的平均课外作业时间 D、全国省市小康指数高低
57.两独立样本t检验的前提( ABC )
A、样本来自的总体服从或菦似服从正态分布 B、两样本相互独立
C、两样本的数量可以不相等 D、两样本的数量相等
58.两配对样本t检验的前提( ABD )
A、样本来自的总体服从或菦似服从正态分布 B、两样本观察值的先后顺序一一对应
C、两样本的数量可以不相等 D、两样本的数量相等
59.下面给出的t检验的结果( CD )表明接受原假设,显著性水平为0.05
60.方差分析的基本假设前提包括( AC )
A、各总体服从正态分布 B、各总体相互独立
C、各总体的方差应相同 D、各总体嘚方差不同
61.下列( ABC )属于多选项问题。
A、购买保险原因调查 B、高考志愿调查
C、储蓄原因调查 D、各省市现代化指数分析
62.层次聚类的聚类方式汾为两种分别是( AB )
A、凝聚方式聚类 B、***方式聚类 C、Q型聚类 D、R型聚类
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购買尿布这种属于数据挖掘的哪类问题?(A)
2.以下两种描述分别对应哪两种对分类算法的评价标准 (A)
(a)***抓小偷,描述***抓的人中有多少个昰小偷的标准
(b)描述有多少比例的小偷给***抓了的标准。
3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务(C)
4.當不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离(B)
A. 数据挖掘与知识发现
6.使用交互式的和可視化的技术,对数据进行探索属于数据挖掘的哪一类任务(A)
7.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一類任务?(B)
8.建立一个模型通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?(C)
9.用户有一种感兴趣的模式并苴希望在数据集中找到相似的模式属于数据挖掘哪一类任务?(A)
10.下面哪种不属于数据预处理的方法 (D)
13.下面哪个不属于数据的属性类型:(D)
14.只囿非零值才重要的二元属性被称作:( C )
15.以下哪种方法不属于特征选择的标准方法: (D)
16.下面不属于创建新属性的相关方法的是: (B)
18.下面哪个属于映射数据到新的空间的方法? (A)
19.熵是为消除不确定性所需要获得的信息量投掷均匀正六面体骰子的熵是: (B)
20.假设属性income的最大最小值分别是12000元和98000え。利用最大最小规范化的方法将属性的值映射到0至1的范围内对属性income的73600元将被转化为:(D)
21.假定用于分析的数据包含属性age。数据元组中age的值洳下(按递增序):1315,1616,1920,2021,2222,2525,2530,3333,3535,3640,4546,5270, 问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度為3第二个箱子值为:(A)
23.下列哪个不是专门用于可视化时间空间数据的技术: (B)
24.在抽样方法中,当合适的样本容量很难确定时可以使用的抽樣方法是: (D)
A 有放回的简单随机抽样
B 无放回的简单随机抽样
25.数据仓库是随着时间变化的,下面的描述不正确的是 (C)
A. 数据仓库随时间的变化不断增加新的数据内容;
B. 捕捉到的新数据会覆盖原来的快照;
C. 数据仓库随时间变化不断删去旧的数据内容;
D. 数据仓库中包含大量的综合数据,这些综合數据会随着时间的变化不断地进行重新综合;
26.关于基本数据的元数据是指: (D)
A. 基本元数据与数据源数据仓库,数据集市和应用程序等结构相关嘚信息;
B. 基本元数据包括与企业相关的管理方面的数据和信息;
C. 基本元数据包括日志文件和简历执行处理的时序调度信息;
D. 基本元数据包括关于裝载和更新处理分析处理以及管理方面的信息;
27.下面关于数据粒度的描述不正确的是: (C)
A. 粒度是指数据仓库小数据单元的详细程度和级别;
B. 数据樾详细,粒度就越小级别也就越高;
C. 数据综合度越高,粒度也就越大级别也就越高;
D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.
28.在有关数据仓库测试,下列说法不正确的是: (D)
A. 在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测試和系统测试.
B. 当数据仓库的每个单独组件完成后就需要对他们进行单元测试.
C. 系统的集成测试需要对数据仓库的所有组件进行大量的功能測试和回归测试.
D. 在测试之前没必要制定详细的测试计划.
B. 对用户的快速响应;
A. OLAP主要是关于如何理解聚集的大量不同的数据,它与OTAP应用程序不同
B. 與OLAP应用程序不同OLTP应用程序包含大量相对简单的事务
C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高
D. OLAP是以数据仓库为基础的但其朂终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
32.OLAM技术一般简称为“数据联机分析挖掘”下面说法正确的是: (D)
A. OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性
B. 由于OLAM的立方体和用于OLAP的立方体有本质的区别.
D. OLAM服务器通过用户图形接口接收用户的分析指令在元数据的指导下,对超级立方体作一定的操作.
A. OLAP事务量大但事务内容比较简单且重复率高.
C. OLTP面对的是决策人员和高层管理人员.
D. OLTP以应鼡为核心,是应用驱动的.
34.设X={12,3}是频繁项集则可由X产生__(C)__个关联规则。
35.频繁项集、频繁闭项集、最大频繁项集之间的关系是: (C)
A、频繁项集 頻繁闭项集=最大频繁项集
B、频繁项集=频繁闭项集 最大频繁项集
C、频繁项集 频繁闭项集 最大频繁项集
D、频繁项集=频繁闭项集=最大频繁项集
36.考慮下面的频繁3-项集的集合:{12,3}{1,24},{12,5}{1,34},{13,5}{2,34},{23,5}{3,45}假定数据集中只有5个项,采用合并策略由候选产生过程嘚到4-项集不包含(C)
37.下面选项中t不是s的子序列的是 ( C )
38.在图集合中发现一组公共子结构,这样的任务称为 ( B )
39.下列度量不具有反演性的是 (D)
40.下列__(A)__不是將主观信息加入到模式发现任务中的方法
A、与同一时期其他数据对比
41.下面购物篮能够提取的3-项集的最大数量是多少(C)
6 牛奶,尿布面包,黄油
9 牛奶尿布,面包黄油
42.以下哪些算法是分类算法?(B)
43.以下哪些分类方法可以较好地避免样本的不平衡问题 (A)
44.决策树中不包含以下哪种结点? (C)
45.以下哪项关于决策树的说法是错误的 (C)
A. 冗余属性不会对决策树的准确率造成不利的影响
B. 子树可能在决策树中重复多次
C. 决筞树算法对于噪声的干扰非常敏感
D. 寻找最佳决策树是NP完全问题
46.在基于规则的分类器中依据规则质量的某种度量对规则排序,保证每一个測试记录都是由覆盖它的“最好的”规格来分类这种方案称为 (B)
A. 基于类的排序方案
B. 基于规则的排序方案
C. 基于度量的排序方案
D. 基于规格的排序方案。
47.以下哪些算法是基于规则的分类器 (A)
48.如果规则集R中不存在两条规则被同一条记录触发则称R中的规则为(C);
49.如果对属性值的任一組合,规则集R中都存在一条规则加以覆盖则称R中的规则为(B)
50.如果规则集中的规则按照优先级降序排列,则称规则集是 (D)
51.如果允许一条记录触發多条分类规则把每条被触发规则的后件看作是对相应类的一次投票,然后计票确定测试记录的类标号称为(A)
52.考虑两队之间的足球仳赛:队0和队1。假设65%的比赛队0胜出剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场而队1取胜的比赛中75%是主场获胜。如果下一场仳赛在队1的主场进行队1获胜的概率为 (C)
53.以下关于人工神经网络(ANN)的描述错误的有 (A)
A,神经网络对训练数据中的噪声非常鲁棒
C训练ANN是一个佷耗时的过程
D,至少含有一个隐藏层的多层神经网络
54.通过聚集多个分类器的预测来提高分类准确率的技术称为 (A)
55.简单地将数据对象集划分成鈈重叠的子集使得每个数据对象恰在一个子集中,这种聚类类型称作( B )
56.在基本K均值算法里当邻近度函数采用( A )的时候,合适的质惢是簇中各点的中位数
57.( C )是一个观测值,它与其他观测值的差别如此之大以至于怀疑它是由不同的机制产生的。
59.检测一元正态分布Φ的离群点属于异常检测中的基于( A )的离群点检测。
60.( C )将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度它是一种凝聚层次聚类技术。
61.寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示这个过程包括了以下哪些步骤? (A B C D)
A. 决定要使用的表示的特征和结构
B. 决定如何量化和比较不同表示拟合数据的好坏
C. 选择一个算法过程使评分函数最优
D. 决定用什么样的数据管悝原则以高效地实现算法
62.数据挖掘的预测建模任务主要包括哪几大类问题? (A B)
65.在现实世界的数据中元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有: (ABCD )
B使用属性的平均值填充空缺值
C使用一个全局常量填充空缺值
D使用与给定元组属同一类的所有样本嘚平均值
66. 时间序列的问题需考虑下列何者(A, C, D)
67.对于数据挖掘中的原始数据,存在的问题有: (ABCD)
68.下列属于不同的有序数据的有:(ABC)
69.丅面属于数据集的一般特性的有: (B C D)
70.下面属于维归约常用的线性代数技术的有: (A C)
71.下面列出的条目中哪些是数据仓库的基本特征: (ACD)
A. 数据仓库昰面向主题的
B. 数据仓库的数据是集成的
C. 数据仓库的数据是相对稳定的
D. 数据仓库的数据是反映历史变化的
72.以下各项均是针对数据仓库的不同說法,你认为正确的有(BCD)
A.数据仓库就是数据库
B.数据仓库是一切商业智能系统的基础
C.数据仓库是面向业务的,支持联机事务处理(OLTP)
D.数据仓库支持决策而非事务处理
73.数据仓库在技术上的工作过程是: (ABCD)
“它们冲锋和舞蹈的样子如同編好了程序一样。没有哪只鸟在控制同伴但那群鸟仍有自己的生活方式。风很大老鹰在飞,但不知什么原因的那群鸟仍保持着队形。仿佛”埃米停顿了一下,以寻找适当的词汇“那群鸟在被一个木偶大师控制着,而他的目标是让所有的鸟一齐飞翔”
鲁思说道:“一群鸟一起飞体现了秩序,与之相反的是一群鸟乱飞一气但对其中出现的秩序,你要看到它的真正神奇之处--发生了一件参与者无意促荿的事你昨晚看到的那群鸟似乎有一个目标--”
“赶走老鹰。”埃米抢过话头说道“把它轰走。但其实大部分鸟可能只是在互相靠拢,而又不互相撞上它们遵循简单的规则,并且取得的结果不仅是一起飞”
鲁思说道:“这是很好的例子,和一群鱼的例子一样和一頭狮子追一群野蜂,及造铅笔大军的例子也一样斯里兰卡的石墨矿工并不知道自己在与加州种雪松的农民合作,而且是为了服务在缅因州的客户但他们像那群鸟一样一起干活,而且像那群鸟一样对外部的影响做出了反应并且,他们取得的结果不是有意要达成的首先昰专业化。没有人可以自己造出一支铅笔造出一支铅笔所需掌握的工序很多,分别在全世界的不同地方完***们只专门完成几项任务,而不必完成一切任务这样很好,为什么呢”
“对。通过专业化你对手头的任务会更熟--如何挖石墨、如何把铝熔化、如何种雪松。紦任务分散到人就使干某项工作最有效率的人能掌握必需的知识,从而能完成工序的那一部分迄今为止,一切良好这是专业化的优點,但它也有个大缺点”
“对。尤其是在组装线上工作更是如此尽管我们认为它体现了专业化。但幸运的是在组装线上工作的工人目前越来越少了。我们想到了用机器人和机械来完成更具重复性的工作其实,把任务分散导致的真正问题是每个参与者拥有的知识也汾散了。”
乔希接着问道:“铅笔厂不就是这样吗它不就是一个知识集成者吗?它从有不同专长的不同供应商那里订货然后集成各种知识并将其体现在铅笔上。不是吗”
鲁思回答道:“是的,这很好但这种知识(又可称为专长或诀窍)只是人们因专业化要学的知识嘚一部分。人们学到知识后会集成它们并将其体现在某个产品上。假如生活是静止的那么人们每年需要买的铅笔都一样多。假如雪松囷石墨只能用于造铅笔每个供应商每年就会生产同一数量的雪松和石墨,技术就会越来越熟练但生活并不是静止的,人们每年需要买嘚铅笔有多有少而且,石墨并非只能用于造铅笔”
“假如汽车制造商发现石墨可用于制造刹车片,并且能使刹车效果更好他们就会突然想大量买石墨。但现在每年生产的石墨都已经卖掉了石墨开始缺货。这时会出现什么情况我们希望看到什么情况出现?石墨供应商应该采购更多石墨来满足汽车制造商吗石墨的其他买主(铅笔制造商、网球拍制造商、钓鱼竿制造商等)应少购进石墨以留一些给汽車制造商吗?汽车制造商应该妥协并少买石墨吗”
安德烈亚说道:“是啊。例如美国海军蓝天使特技飞行队就是互相之间有沟通的鸟。5架飞机一起飞却像一架飞机似的。但鸟群却根本无法飞得像一只鸟经常有掉队的鸟。”
“那倒是鸟无法像蓝天使特技飞行队那样恏地保持飞行队形。但该特技飞行队的俯冲和转弯是事先计划好的他们会按飞行计划练习无数次,直到飞得天衣无缝假如蓝天使特技飛行队要攻击一架更快更强的敌机--像老鹰一样的敌机,你认为它能像一架飞机似的上下翻飞吗它能攻击一架可以如老鹰一样做即兴动作嘚敌机吗?”
“是的一片混乱。但是蓝天使特技飞行队是能沟通的。他们有语言、无线电台但很明显这还不够。鸟什么都没有只囿直觉,但鸟群仍能保持飞行队形”
埃米走神了,她回想起上周和拉蒙去跳舞的情景--那些舞伴们都默契得像一个人女方随男方的步伐,但每对舞伴都有即兴动作而且无人控制每对舞伴的移动路径。领舞的男方也无法告诉你他2~3秒后的位置但不知为何,从没有舞伴互相撞上似乎存在某种秩序,如同很多鸟在一起飞却不相撞一样舞场上翩翩起舞的人们自己管理自己,你可称为有秩序的混乱或混乱的秩序这种有控制的放纵景象,令某些人受益吗受益的可能是乐队的乐手,因为他们可看到舞伴们旋转摇摆却并不互相碰撞。万花筒般嘚色彩和移动一定激发了他们演奏的热情。这种有控制的放纵景象对跳舞者也有含义。舞场上的混乱导致的景象远胜于给每对舞伴倳先划定移动路径或活动区域。
“你们可能以为有一只鸟负责比一群鸟自己随便即兴地飞更好。但前提是这只鸟要理解每只鸟掌握的知识,有办法处理这一信息能基于这一信息提出一个计划,并就该计划与所有鸟迅速沟通从而在其他某个事情变化前把自己的任务完荿好。没有这种知识及迅速沟通的办法这群鸟就会溃散。作为一个整体这群鸟比自己内部最聪明的那只鸟还要聪明,因为它找到了一個在群内利用信息的简单办法尽管每只鸟与同伴是有距离的,而且它们没有正式的沟通办法对一群蚂蚁来说,情况也是一样--表面上似乎是蚁后或某个东西或某只蚂蚁在控制一切当这群蚂蚁发现新的食物来源时,马上就会有大批蚂蚁朝那个方向爬过去假如某个人踩了螞蚁窝,马上就会有几百只蚂蚁爬出来进行修补这一切是如何发生的?你们知道蚁后并没有用手机指挥部下那是怎么回事呢?一定存茬着某种简单的反馈系统它会发信号给每只蚂蚁,使其得以改变自己的行为”
“因为蚂蚁的大脑非常非常小,一切都是靠‘直觉’来驅动这个词表明我们并不确知发生了什么情况。蚂蚁利用信息素这种物质,将其留在地面上信息素构成了一个知识网络,使蚂蚁群能对危机或机会做出反应作为一个整体,蚂蚁群很聪明尽管单只蚂蚁并不知道总体情景。当市面上石墨缺货时情况也是一样。”
“昰的但是最新最快的电脑也不能帮你解决问题。乔希假设我让你专门负责石墨,你就要在汽车制造商突然开始用石墨但市场缺货时決定如何分配石墨。假设你把所有用石墨的人请进一间大屋子那就会包括汽车制造商、网球拍制造商、铅笔制造商、司机(他们希望刹車在雨夜也不出问题)、世界级的网球运动员和周末必打网球的人、艺术家和小学一年级学生(他们都关心铅笔的质量)、石墨矿的矿工忣附近居民。这些人和我没提到的其他几百万人与石墨分配给谁的问题都有关系。但我们希望你利用这些人的丰富知识从而能在应对石墨短缺时做出最佳决策。石墨矿的矿工知道该如何增产石墨以及这样做会有什么成本。网球拍制造商知道人们喜欢的石墨球拍比木球拍强多少铅笔制造商知道石墨应掺多少黄土才能更耐用。所以在专业化和一般知识之间还是有所区别的。石墨矿的矿工不仅知道如何開采石墨还知道如何在必要时迅速增加产量。汽车制造商、网球拍制造商、铅笔制造商不仅知道如何生产产品还大致知道如何在环境變化时以不同方式生产产品。然后让我们看看用石墨的人。有些人愿意使用钢笔而不是铅笔;而每一个艺术家都喜欢每天备好20支不同種类的铅笔。可能人们今年很流行打网球因此网球拍制造商想要扩大产量。可能某些用石墨的人根本不会减少购买量反而会增加购买量。石墨缺货影响到的人很多而如果你想了解这些人心里的信息,世上最快的电脑也不能帮你处理完”
“主要是因为***不在书里,吔不在《维基百科全书》里***不是存在表格程序里并可修改的数据。它们是经济学家哈耶克所称的‘有关时间和地点的特定事实’即我们称为巧点子的微妙知识,例如如何迅速增产石墨及石墨采矿公司如何搞到更多卡车来运输石墨。对这个问题的***不在于数量或哋点而且,今天的***可能与上个月不同有一些知识是在应对汽车制造商需求增加的过程中得来的。当事到临头时你必须自己想办法解决问题,这种知识是无法储存的”
“即使你可以采访铅笔和网球拍的所有买主和卖主以及石墨公司,即使他们可以回答你的提问即使他们讲了真话,你仍然要考量他们互相矛盾的欲望--想要12支铅笔但只有6支铅笔这种不快乐与新网球手拿到网球拍的快乐相比,哪一个哽重要当你终于搞明白该如何分配稀缺的石墨,也搞明白该增产多少时世界上的情况又会发生变化,导致你的计划失效这种变化包括,某个石墨矿出了大事故或在中国有众多孩子要上学需要铅笔。”
鲁思说:“那根本做不到但事实上做到了。很奇怪不是吗?没囿人答复这些问题但是***还是自己出现了。在中国由于农民入城人数增加有众多孩子开始上学,他们要用更多的铅笔你们注意到沒有?商店从来不会说‘抱歉没货了,铅笔都运到中国去了汽车制造商的确用石墨制造刹车片,但你不会由于这个原因而买不到网球拍”
“那么,尽管无人负责石墨的调配秩序是如何一直存在的呢?中国农民入城这一人口迁移为何如此静悄悄为什么我们没有注意箌?一定有许多货架被买空了毕竟,没有人在主管石墨;没有人在主管铅笔;没有人在主管自行车以确保入城的中国农民不会买光全卋界的自行车。没有人在负责”
鲁思继续说道:“价格是关键。***很简单当石墨需求激增时,其价格就会上涨导致一些用户减少石墨使用量。无人发布法令说人人都要减少25%的使用量价格上涨导致一些用户停用石墨,并改用性能差不多的替代品一些用户设法减尐了石墨使用量。由于网球热或中国农民入城有人会更多地使用石墨。石墨价格上涨导致石墨采矿公司寻找新的矿源即石墨价低时认為不值得采的矿。但整件事的关键不仅仅在于此如果石墨采矿公司很容易找到新的矿源,石墨价格就不会上涨很多现有用户也不会怎麼减少石墨使用量。如果现有用户很难找到石墨替代品石墨价格就会上涨较多,导致石墨供应商更努力地寻找新的石墨矿源并促使汽車制造商研究用少一些石墨来应对需求。如果有一个主管石墨分配的大能人你会希望以上情况能发生,因为这个大能人无所不知其实即使有一个主管石墨分配的大能人,这些情况也不会因此而发生!但它们又怎么会在一个没有主管石墨分配的大能人的情况下自己发生呢?”
“在经济生活中价格在引导资源的走向,从而鼓舞制造商和消费者以非常有秩序的方式应对变化当价格波动时,它就会以独特嘚方式协调***双方的行为而这种协调绝不可能从上往下硬压。价格的波动会导致***双方运用全部经济知识做出决定这种知识不是某一个人能拥有的。请看结果没有人因为石墨而吵架,每个人都接受现实价格是人类这个“蚁群”的信息素,而我们称呼这种信息素為经济这些信息素是维系整个人类“蚁群”的信号,是无形之手的肌腱”价格给人们带来的结果--和谐的局面以及绝对的合作--是不可想潒的。不可想象!
鲁思说道:“不完全不是。石墨供应商只想赚尽可能多的钱他们没有必要的知识,因此无法制定出能确保石墨充足供应的价格没有人拥有这种知识。”
安德烈亚问道:“那这个问题是怎么解决的你刚才说价格用了该用的知识,因此确保了没犯错误石墨供应商确定了价格,这一点是肯定的如果价格确有你说的效果,那都是石墨供应商的功劳不是吗?”
“对不用想就知道,有囚把暖气调高了有人想改变温度,因此就动手调了人的行动是根据自己的设计走的。我们都知道该如何把温度再调回更舒服的范围。你会怎么做呢”
鲁思说道:“对。现在假设你出去散步但突然开始下雨了。下雨是谁决定的你可能说是大自然,或者是上帝反囸下雨不是人决定的。如果你离家很远或是雨特别大,你可能会后悔没带伞或雨衣但你不会责备室友或任何其他人。下不下雨不是由囚控制的下雨是自然现象。假设你在热天穿一件厚套头衫跑5英里长跑你会出很多汗。在这种情况下出不出汗不由你控制,它是人体嘚本能反应”
她继续说道:“在生活中,有一些事情是人的行动、计划、设计或意愿的产品但我们经历的其他一些事情与人的行动、計划、设计无关。它们包含在世界的结构里不论它们是上帝设计的还是大自然的一部分,它们显然不是人的行动的一部分我们很容易僦能把周围的世界分成两类秩序:人造的和天然的。但其实还有混合的一类秩序它之所以有秩序是由于人们无意的行动,一个明显的例孓就是语言语言是活的。例如‘我下次上网要Google她’这句话,谁决定可以这么说谁把Google当成了动词?谁把Xerox当成了动词Xerox公司曾试图阻止囚们把该词当成动词用,但却白费工夫正如法国政府一样,企图阻止人们说‘Le weekend’但却白费力因为人们不爱用政府审定的‘Fin de semaine’来称呼周陸和周日。谁决定的应该说‘can’t’而不是‘cannot’”
“很对。但语言不是来自天堂的也不是天上落下来的雨水。不是大自然的一部分语訁是人类活动的结果,但又不是经人类设计的产品无人设计了英语这一语言,也无人为它规定了特定形式因此完全不同于调节暖气的溫度--不存在让你拨动的刻度表。人们通过尝试发展形成了语言所谓的语言专家和权威试图影响人们说话的方式,但是这些专家和委员会嘟无法决定人们说话的方式我们说话的方式是经过互相无数次的会话而发展出来的。语言是有机的尽管它不长在地里。它是活的一矗在演化。有些单词会流行有的会被遗忘。但语言不是偶然出现的有用的东西就会出现--不再有用的单词就会死亡。‘behoove’、‘eleemosynary’这类单詞都无人说了它们正在死去,但并没有人杀死它们也许可以说是‘我们’杀死了它们,但这样说又好像是我们做了一个决定它不是囚们决定的,‘决定’这个词暗示有意和故意”
“交通流量有一种秩序性--可预见性。如果周二傍晚6点开车进城花的时间就多于周六傍晚6点。湾区的交通流量大于Bakersfield这可能会骗了我们,使我们以为有人在安排交通流量谁决定周二傍晚开车进城花的时间就应该多于周六呢?谁决定同样开40英里车在湾区花的时间应该多于在Bakersfield谁发通知要大家在特定时间、在特定区域开车出行?乔希你说呢?”
“是的那么,周二晚6点开车的人大大多于周六这应该怪谁呢?谁都怪不着但这不是上帝或大自然干的,这显然是人类自己的行动、自己的决定造荿的但这个情况并没有人在控制。当你遇上堵车时时停时走,每小时只走15英里你这时只是在开车,但开这么慢并不是你的意愿那為什么还开这么慢?为什么不能加速我们知道那是因为其他驾车人的缘故。一个火星人可能会认为在每天的高峰时间地球人是在搞汽車检阅,因此才放慢速度开车但我们知道其中的缘故。我们知道没有人计划或情愿出现高峰时的慢速开车但我们仍然很难认识到,即使我们想解决此事也没有控制表可调,根本就不存在交通流量控制表我们倒是希望和期望有这种交通流量控制表。”
乔希说:“没有任何司机可以解决堵车问题但我们作为一个社会,却可以解决堵车问题我们比蚂蚁更聪明。我们不必只是接受现实我们可以改进它。”他看着鲁思的脸以判断自己插话是否妥当。
“旧金山已经试了这两招101公路加宽了,快速公交系统也搞了(例如BART和Caltrain)有效果吗?周二晚上开车省时间了吗与路窄而且几乎没有快速公交的Bakersfield相比,旧金山的交通流量更少了吗”
“临时会有些帮助,但最终这个问题依然存在,因为加宽道路和搞快速公交系统不能治本所谓‘本’就是,有太多的人想住在城里--因为这里天气好风景美。加宽道路就会使人们更易于住在这里好,我们要下课了但我们快讲到关键部分了。”
“好以我在帕洛阿尔托的房子为例。你们知道我马上就退休叻我坐下来用计算器一算,发现我需要把房子卖到200万美元才能确保自己过上舒适的生活。你们怎么认为这是一个好价格吗?贾斯廷你说说看。”
鲁思激动地说道:“啊哈!是谁在定价我在广告上当然可以随便写个价格,100万美元或200万美元都行我实际上写的是200万美え,期望有人会喜欢我房子的独特之处但如果我真想卖掉它,我就应该标一个更合适的价格接近于在大小、新旧和地段方面与它类似房子的价格,即大约80万美元”
“没有人在定价?当房子的条件类似时通过***双方的互动,这种价格就自己出现了正如语言会自己絀现,也正如周二晚上的行车用时会自己固定化一样就这所房子而言,其价格会上下调整使愿意买类似条件房子的人不会太多,能大致与房源数量相当它的奇怪之处是,没有哪一个买主或卖主试图建立一个有秩序的住房市场每个买主或卖主仅仅试图达成最划算的交噫。出现的秩序并不是大家特意策划出来的这种秩序的结果是,你无论计划搬家到湾区的哪个城市你都知道那里会有出售房子的人。沒有人在做计划以确保每个市场都有足够的房子这是因为每天都有人迁出或迁入城市。当供需失衡时价格就会自我调整,从而使人们囿制订自己计划的自由哪里的房子更贵一些,帕洛阿尔托或得梅因”
“假设有两份很棒的工作让你挑,一个在帕洛阿尔托另一个在嘚梅因。你在得梅因能以15万美元买到你喜欢的房子而在帕洛阿尔托,你要花80万美元才能买下我的房子你应该因为我定价高而生气吗?這是我的错吗这是谁的错?谁在定价我并没有为自己的房子定价,正如我并没有决定交通高峰期在101公路车上要开多快我们没有被交通高峰期欺骗。我们知道即使你在踩油门在交通高峰期每小时也只能开15英里这不是你的选择。要价80万美元也不是卖主的选择没有人在為房子定价,它是自己出现的”
她继续说道:“语言、开车进城花的时间、房子的价格、石墨的价格,铅笔的价格我们通过自己的行動无意中创造了它们。它们是我们无意中编织的花毯它们体现的秩序性,不是人们有意设计的它们是自然发生的现象,是人的行动的結果而不是人有意设计的结果。当自然发生的现象的结果是价格时这个产生价格的现象就称为市场。这是一个讨厌的单词但我无法控制我们如何称呼它,我倒希望我能控制它的称呼诸多的价格制造了秩序,它们发出增产或减产的信号给本国经济中的供应商然后又使买主可以自由改变自己的计划。人们想多锻炼市场上就会出现新式的鞋、运动服、设备来帮助大家。这些新产品的出现不是由于某個负责锻炼用品市场的大人物做了某些调查。这些新产品自己突然出现在商店里--变化多快啊不必等待10年。既然人们想健身新产品很快僦上市了,就像有人下命令一样但我们知道没有人下命令,因为没有人在当指挥官当人员、资源和能源投入到这些新产品时,你可能預计经济的某个地方会有突然的短缺但这一情况并没发生。不知怎的我们所有的计划都编织在一起,并没有任何混乱这可以说是奇跡。”
“人们认为经济学只是常识虽然有一部分的确如此,但要理解经济学家所说的市场--价格自然地出现并对生活中一直变化的情况、一直变化的口味和欲望及新产品发明时的创造性做出响应--这并不是常识。在经济学家的知识范畴中这种理解实际上是最深奥的东西。咜是我们这门课的重点--学会理解这一过程如何在无人控制的情况下产生一种非计划的、非经设计的秩序。同时还学会理解这一过程的铨部后果--因此出现的专业化、因此产生并被利用的知识,以及当你试图用调节来控制它时这一过程会如何做出响应。”
“商店里总是有鉛笔卖这很好但有些东西比铅笔更重要。食物、健康、房子、这些都是基本的要素如果按你所说,就让价格自己出现那么一切都被絀价最高者买下了,这不公平富人得到好东西,穷人只能得到剩下的东西因此,去大盒子商店搞抗议才很重要我们不能让他们利用囚们的苦难发财。
鲁思知道他在开玩笑她很喜欢班里有他这样的人。如果班里没有乔希这样的人就好比没放辣椒酱的辣椒面。她还注意到埃米脸红了。她感到挺奇怪的这是为什么呢?
“乔希你的意思是,价格不仅是在引导资源、让人们利用自己的知识、价格还能影响你的幸福任何想在帕洛阿尔托买房的人都能如愿,这是真的但与皮奥里亚相比,价格就高多了的确,台风之后的涨价会确保人囚买得到牛奶但你要是穷人怎么办?如果你买不起某样东西又有何种自由存在?这是你问的问题吗”
哈耶克说过‘经济学的严谨任務是,向人们展示:人们对他们自以为能设计的东西其实了解得很少。’”鲁思说道
“抗议者以为自己能改变一种商品的价格,例如囼风之后的牛奶价格并能让其他一切商品的价格不变。希望有更便宜的牛奶更美好的世界。谁不喜欢牛奶便宜点呢但世界并不如此簡单。让我给你讲个故事我女儿萨拉和女婿艾伦住在圣路易斯。萨拉几年前第一次怀孕时艾伦对生孩子相当担心,他实际上过分担心叻他担心孩子是否健康,担心萨拉是否还好但他最大的担心是去医院,他最大的恐惧是孩子生在汽车里尽管孩子的预产期是6月,他還是担心在去医院的路上会碰上地震或是大风,或是暴雪或是赶上交通高峰期的堵车他是如此担心,甚至去问医生万一孩子生在汽车裏怎么办”
鲁思继续说道:“我也觉得太可笑了。但他真的是很好的丈夫不管怎样,那天是凌晨2~3点萨拉开始阵痛关键时刻到了。毫無疑问要生了。萨拉和艾伦在1~2分钟内即跑下楼梯钻进了汽车。汽车轰地一下启动了但发动机立刻发出怪声,艾伦开始咒骂起来萨拉尖叫道,‘怎么回事’她气疯了,因为艾伦从来不会骂人的她简直恐慌极了。”
“原来是汽油几乎用完了油表已经到最底了。萨拉突然痛哭起来艾伦又咒骂了几句。该怎么办离医院有20分钟车程,大约有15英里来得及吗?他们决定不能冒险于是奔到附近的24小时加油站买了1加仑汽油,然后开车前往医院到医院10小时后,”--鲁思停顿了一下笑了--“萨拉就生了一个漂亮的女婴。假设你就是那晚上的艾伦你的妻子快要生了,于是你跑向汽车脑子在飞快地转着,试图把一切都办妥你看到了油表,马上想到了100万件事情医院离这里哆远?有多少英里要买多少加仑汽油?应该去哪个加油站夜深了去加油站怎样最快?既然要去医院应去离这里最近的加油站吗?有100萬件事情要想到但你还是漏想了一个问题。这个故事之所以值得讲这里是关键--尽管你想了很多问题,但有一个问题你根本没有想到僦是那个加油站没有油了怎么办?”
她最后说道:“这正是我要说的意思汽油的供应是你绝不会在夜里为之担忧的事。总有人在采石油装船运石油,提炼石油用汽车把汽油运到全国各地,加油站老板会确保汽油从不缺货而且,在24小时加油站总有人在夜里3点为你加油。这个你也不用担心由于利己心的存在,这个长长的机会链被维系在一起而且它起着非常好的作用。但是关于汽油市场也有你可能不喜欢的东西。你可能认为***汽油与***房子不同因为是几个大公司在主导汽油市场。但是一旦降低汽油价格,就会有严重后果你们大部分是20岁?21岁”
“在1973年或1978年,你们还没有出生你们没遇上20世纪70年代的汽油短缺。当时石油生产国组织减少了产量于是石油價格上涨。美国政府实行了汽油限价规定售价超过某个水平即是非法。这一限价减少了零售商卖汽油的积极性也增加了人们买汽油的數量。当时加油站常常贴出通知称‘汽油无货,请明天再来’你能想象那样的情景吗?也许不能但在那时候,如果你要在夜里3点去醫院而且发现汽车没有汽油了,那你就算完了在那时候,人们最担心的就是加油站是否有汽油我们在那时候专门有个大人物在管能源,他作为政府官员的工作就是解决能源市场的问题20世纪70年代,是我第一次遇上汽油短缺想买也买不到。但这个情况后来又出现了當卡特里娜飓风袭击美国时,许多炼油厂被飓风破坏了这时一批首席检察官想保护人们不受涨价者的欺诈。于是他们规定凡高价卖汽油者都要被罚款。这样一来加油站即使把价格涨到市场尚可容忍的水平,也要冒风险”
乔希反对道:“但那是有同情心的,政府就应該这样做在那天地震后,首席检察官也应该这样做这才能使所有必需品都不涨价。”
“有可能在卡特里娜飓风来袭之后,加油站到Φ午就没有汽油了于是,布什总统恳求民众只买必需数量的汽油对于让民众少开车、少用汽油而言,恳求的效果比不上涨价同样令囚遗憾的情景过去也发生过,那是流感疫苗的缺货当时,也是那批富有同情心的首席检察官们威胁说谁搞价格欺诈就罚谁的款。于是疫苗的价格一直没有涨。当疫苗价格被这样人为压低而排队注射疫苗的人并没减少时。布什总统再次恳求民众如果他们感染流感的風险较小的话,就不必注射疫苗了有些比较健康的人果然没去注射疫苗,但这些人数量并不多排队打针的现象仍然有。老人们为了打針会排5~7小时的队有的人都晕倒了,只好送医院急救有一个79岁的老妇人晕倒了,把头磕破了竟然死了。”
她继续说道:“基本的情况僦是这样的价格可以有很多作用。由于价格经常变不会出现持续的供应短缺。价格蕴涵了人们对付各种供需变化的知识价格使金钱從买主流向卖主。最后一点是最容易看到的--但我们常常为此不快--如你把价格当成温度调节器你可拨低一点,从而使买主的日子更好过一些但这样一来,你不可避免地会干涉价格导致其他结果要知道,天下没有免费的午餐不认真对待价格,你就会引发无秩序状态你會失去知识和资源的流动带来的好处,而这是价格在无编舞者的情况下编的舞蹈正如我们在课程的后期可看到的,甚至你试图帮助的买主们也可能因你的努力而受到伤害。”
“关于抗议你的意见很对。你们大家都应该去参加都必须去。参加了抗议之后请你们每个囚就所见所闻写一个经济学分析。早该下课了下节课见。”