统计学本科课程对口工作就那么难找吗

统计学专业就业前景与就业方向_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
统计学专业就业前景与就业方向
上传于||文档简介
&&统​计​学​专​业​就​业​前​景​与​就​业​方​向
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩3页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢cocofox: 请问楼主是哪个学校毕业的?还有国内的话,哪几个大学的统计学专业最好? 如果学统计,是不是硕士毕业,才是找到一份好工作的敲... - 雪球&来自雪球请问楼主是哪个学校毕业的?还有国内的话,哪几个大学的统计学专业最好? 如果学统计,是不是硕士毕业,才是找到一份好工作的敲门砖?:统计101科普本人2008年底金融危机时候获得统计硕士学位,然后从事统计工作至今。一直想写一篇关于统计的文章。用最通俗易懂和语言和接地气的例子来讲一些统计的基本概念。目的就是人人都能轻易看懂,不会有任何数学公式或者复杂的概念。 另外本文绝大部分内容非常浅显,没什么高大上的东西。首先统计到底是干什么的?如果用一句话总结那么我最喜欢的就是我导师说的“evaluating&weight of evidence”即衡量证据的重量。这话比较绕口,其实就是看一些现象是真实存在还是纯粹的运气凑巧。 比如你得病了,吃了一种药A,然后病好了。这时到底是药物A有治疗效果还是纯粹的运气好:你不吃这个药,病可能也会好。 你根据一种你的策略买卖一个股票赚钱了,到底是这个策略是真正有效的还是你运气好?学统计有什么好处?抛开很现实的好找工作,最大的好处是锻炼你的理性思维。统计是一门改变思维方式的学科。(相比计算机就不是改变思维的学科,而是一门提高思维敏锐度的学科。计算机高手的反应都非常快)。学会用统计的方式看问题你就会变得越来越理性。当别人给你一个结论你第一反应是这个结论有没有数据支持?缺乏统计思维的人很容易陷入一些常见的逻辑误区比如:1: 使用个例来得出结论。这个是最常见的逻辑错误。很多人说“高等教育没用,赚不了钱” &这些人举出的例子无外乎是“XXX(名人)大学辍学现在创业多牛逼” “我隔壁的XXX从小成绩不好,现在做生意赚了很多钱” “我认识的XXX上了名牌大学现在不也是赚个平均工资而已,还不如我YYY成绩超烂的中学同学混得好”等等等等例子。实际上这些都是用个例来推导结论。正确的比较方式应该是对比各种学历的人的平均工资是多少。比如把人分为几个组: 没学历,小学学历,中学学历,本科学历,硕士学历,博士学历。然后算出这些人的中位数工资(为何不用平均工资后面会解释)。我相信得到的答案应该是学历越高的组中位数工资越高。 另外类似的结论还有“学金融,经济学对投资没有任何帮助”等等,举例就是“没见过哪个金融教授发财了”2:一些骗局也是利用人们的逻辑漏洞。假设一天你收到一个推荐股票的电话给你说他们有内幕消息知道X股下周要涨。你认为他们是骗子,但是闲着无聊还是关注了这个股票。结果这个股票真的涨了很多。第2周你又接到同样的电话给你推荐Y股下周要爆发,结果Y股走势真的很好。第3周同样给你推荐Z股,结果也是对的。你这时就开始怀疑难道他们不是骗子?真的有内幕消息? 第4周又给你推荐一个新的股票而且又大涨了。这时你开始相信他们真的有内幕消息。然后第5周他们让你加入QQ股票收费群,会员费只收888!你一想888算什么,抓一个涨停8888都回来了实际上是怎么回事呢?其实很简单比如他们找到1w个股民,给他们分组推荐100个股票。一周以后可能其中50个股票涨势很好。然后给剩下的5000人打电话再分组推荐100个股票。第2周以后剩下2500个正确的组。 同理一直这么下去。到了第4周以后可能就有“幸运的”一组500人一直都蒙对了。这500人可能有50个人信了这位“有内幕消息的股神”同时加入了QQ群。这个简单的骗术就成功了。3:一些迷信也是因为缺乏统计知识比如“本命年要倒霉” 举得例子就是周围的“XXX本命年的了一场大病” “XXX本命年出了车祸”等等,好像一打听很多人真的本命年倒了大霉!实际上是怎么回事呢?是因为有更多人的其实本命年也没发生什么。但是他们不会告诉你,你也不知道而已。这个就是典型的偏差bias。下面我来讲讲统计中最常见的术语和概念平均数: 这个太简单小学生都知道。。就是算术平均而已中位数:&就是字面的意思,排在中间的那个数字。中位数是一个很重要的概念因为它能排除很多的特例,极端值(outliers)假设你有一个5个股票的组合。 其中PE是 8,12,15,25,600(盈利太差)。 你这个组合的平均PE就是(8+12+15+25+600)/5 = 132. 中位数则是15。 这时候只看平均值还以为你的组合都是超高估值的股票。原因就是一个极端值极大的提高了整体的PE。这时中位数能更好的描述你的组合估值水平。之前收入的例子用中位数也是这个原因,不让个别的巨富的人来抬高整体平均工资造成一种错觉。也就是我们经常说的“我又被平均了“权重:简单来说就是重要程度,占比多少。一个典型的例子就是考试AB卷。A卷满分100分,B卷满分50分。总分是A卷*50%+B卷。 假设你A卷90分,B卷40分那么你的总分就是90/2 +40 = 85分。 股市里面的权重股就是在指数里面占比高的股票比如A股的银行,保险,券商公司。 CPI调节也是靠改变权重,比如最近食品特别是猪肉暴涨,但是为了不让CPI开起来太高引起恐慌所以就把猪肉的权重降低就好了 经常说的CPI造假其实不是用假的价格数据而是改改每个东西的权重即可统计期望值: &这个概念在股市里面特别重要。通俗的话来说就是按照概率的纯理论值。 比如你猜硬币正反,理论上你的胜率是50%。但是你只玩2次,很可能2次都对的,或者2次都错的,你实际胜率有可能得到100%或者0%。要得到这个理论胜率50%你就必须重复玩很多次。 这里就是一个极为重要的理念:你想得到理论值就必须重复试验很多次。 在股票里面这个就是分散投资背后的基础理论之一。假设你认为白酒复苏了&& &“大概率要创历史新高”你认为& &“大概率有马太效应,强者恒强,未来要股票长期走牛”你也认为& &“大概率要继续领跑,拉开和蒙牛的差距”还有几个判断“X,Y,Z股票大概率未来要赚钱”好了。这么多“大概率要赢”的投资你到底是投哪一个呢?是全力投资茅台吗?还是全力投资恒瑞或者伊利,或者XXX股票? 万一你的判断是错的呢?股市里面没有100%确定的东西。这时候统计期望值就能发挥作用了,让你把分析出来的“大概率赢”实现。假设你找到15个“大概率赢“的股票组成一个组合。那么只要这些股票真的胜率是比较高的,那么你必然赚钱。但是如果你只押宝其中的1~2个结果就不一定了。标准差:标准差是衡量波动率或者更专业的术语“离散度”的数据。 标准差大的数据说明大家距离平均值有较大的不同或者说波动大。在现代金融理论里面这个经常被用来衡量“风险”(净值波动大=风险大,净值波动小=风险小) 当然这个是有很大争议的。 但是确实找不到另外一个更好的指标来量化衡量风险。 另外一个误区是用标准差和平均值来做简单的预测。 比如多年小明考数学平均为80分标准差为10。 这里并不能简单的预测小明下一次数学考试为70~90分。 正确的预测为: 假设小明成绩为正态分布,那么我们有95%的信心认为小明未来N次考试的平均分为 80+- 10*1.96 = 60.4~99.6& 是不是等于没有预测。。正态分布: 数据有多种分布,最常见的就是正态分布。这图就是一个完美的正态分布。 线条下面的面积就是概率。这世界有一个奇妙的现象:基本上绝大多数东西都是类似正态分布。 比如工资,寿命,身高,体重等等。 统计中很多预测的假设都是数据是正态分布。比如常规的风险价值VaR(value at risk) 就是这个假设。出问题也通常是这个假设导致的。因为正态分布严重的低估了极端现象出现的几率。在股市里面实际上正态分布图会更加扁,边缘极限值有更高的几率出现。 改进的VaR用T分布(其实还是会低估风险,但是比正太分布好多了)后来人们都发明了各种更高端的模型来解决这个问题,比如收益率用椭圆形分布。现代统计证明有效性,差异性的方法: 这个就是统计学里面的最核心的东西之一。要证明一个东西的效果或者差异性是真实存在的而不是因为运气。 假设一个外星人来到地球的一个大学教室,他惊奇的发现坐在左边的人的平均身高明显比坐在右边的人高。于是他得出了来到地球的第一个理论:教室里面左边的人会比右边的人身高更高! 当然我们知道这个理论明显是错的。他只是碰巧遇见了一个这种教室。如果这个外星人多去几个教室看看就会发现有些教室左边的人个子高,有些教室右边的人个子高,有些教室左右的人身高都差不多。结论就是身高和你坐在左边或者右边其实没有任何关系。统计是如何解决这个问题的呢?现代统计的经典模式:做一个假设H0:比如男的和女的平均身高一样。那么H1就是 男的和女的平均身高不一样。然后用数据最后得出一个证据的分量(p-value)。也就是H0成立的概率。(在“平行世界”做无数次实验。。) 比如p-value=0.01 也是就是男的和女的平均身高一样的概率为1%。 那么这个就是证据就说明了H1的正确性:男的和女的平均身高不一样。 然后还能得出一个系数说明男的比女的高多少。。同理医药试验中的H0:药X没有效果, H1为药X有效果。所以你常常看见文章里面写药X &p-value=0.005 说明药有效果。 通常我们把小于5%的概率称为H1成立。好了今天就写这么多。统计对于一般人真正的意义不是掌握很多复杂的数学模型(你如果不是干这行的这些数学模型也在生活中没什么用),而是让你掌握统计的思维来看世界。这是一种看问题用概率的思维,一种量化的思维,一种喜欢看数据再做结论的思维(而不是凭空想象)最后题外话来说说别人经常问我的一些问题1: 统计好找工作吗?能干什么工作?答: 非常好找工作,统计是工具类学科,各行各业都需要统计人才。比如市场调研,医疗行业特别是制药行业,各种分析行业,银行风控等等。反正需要分析数据的都需要统计人才2:统计工作上班到底在干些什么?答: 不停的写程序 最常见的软件是SAS
打赏同时转发到我的首页拒绝回复支付并发布发布分享到微信扫一扫统计学入门必看,别走这样的弯路_经管之家论坛-爱微帮
&& &&& 统计学入门必看,别走这样的弯路
论坛君:想要打通统计学习的任督二脉,爱上统计学吗?。今天小编为大家推荐一篇来自果壳网的网友清扬婉喵的文章,------文中不仅系统盘点了统计学习的经验和感悟,更对统计的学习资源做了悉心的标注和罗列,也能从中看到美国统计教育的教学模式,对于统计学入门的新手以及跨学统计专业的朋友们来说,依然有一定的参考和借鉴价值。作者:清扬婉喵 ,& 来源:果壳网 作者简介 毕业于美国一个统计学专业排名前10名的公立大学。今年6月刚刚毕业。从大二上第一门统计专业课算起,已经和统计学打了三年的交道了。我从最开始bychance进的专业,到觉得这个专业无聊,再到开始对这个专业不讨厌,最后到现在觉得这个专业很性感,决定和统计学继续把交道打下去,其实中间还蛮曲折的。属于非常努力的那种学生,但是因为天赋有限,所以“努力”让自己在整个专业中的成绩稳定在中上游,“缺乏天赋”使自己没有能成为最优秀的。但是就是因为这样,才觉得自己在学习统计学方面的经验和体会对于大部分组员们还是很一定参考价值的。相信大多数刚进来统计学专业的弟弟妹妹们,对统计学的理解就是限定于“概率”。比如一个袋子里面3个球,两个红的,一个白的,蒙住你的眼睛,问模到白色的球的概率是什么。我当时觉得这就是统计学,统计学就是这个。所以就导致了在学基础的数理统计的时候,对基础理论的掉以轻心,以导致之后花了1000%的力气去弥补当年的损失。为了避免学弟学妹们和我一样犯同样的错误,我一定会在这个帖子中好好承认我当年的问题,总结我当年血一样的教训,希望大家在读了这帖子后,有点启发,少走点弯路,多点时间去锻炼身体,以便更好地享受你和统计学有价值的时光。 1.关于专业的选择:你一定要给你自己一个机会 相信有很多看到这篇帖子的同学还没有学习过这门专业,或者说是打算尝试下这门专业。从我的角度来看,我觉得大家不管上第一门统计课的动机如何,都应该给这个专业一个走进你的机会。不单单是对于统计这一个专业而言,其实是对于所有专业都是这样。我为什么这么讲呢?我高中是文科生。数学一般。物理奇烂。高一期末分科考试,因为物理不计入总体成绩,我又打算学文,于是就破罐子破摔,物理以17/120的成绩结束了我人生中最后一门物理课。真的是人生中最后一门物理课哦,这种恐“物”心理一直延续到我大学毕业,都没敢再上一门物理课。我来美国读本科以后,其实也非常排斥数学,也因为我是文科生,从高二分科后,就觉得自己数学不好。其实这种心理暗示很恐怖的,自己总是觉得数学不好不好,就越发真的不好。于是本科打算进的专业也不能和数学有太大关系,于是就说学经济吧。后来发现,自己对专业的选择是多么幼稚可笑。学经济的人的数学能力应该是非常非常强的。我记得我的一个助教,她过去是北航学习物理的,现在是我本科学校的phd。她说经济学中的数学推导是最令人发指的,发指到她算着算着就不知道自己到底为什么这么算了。所以说大家在进去专业前,一定了解这个专业的性质是什么。我当时选择经济,就是因为国人都学,觉得这个是个很高级的专业。没有想到的是,经济学就要读PHD才有出路,且就业压力极大,除了faculty这条路基本上没有什么路了。然后,大一上着上着的时候,知道了原来学校还有一个专业叫AppliedComputationalMathematicalScience,简称ACMS,是应用数学专业的一个本科分支。这个专业有个分支是数学经济。我觉得要不再选择个这个专业吧。虽然有点数学课,但是硬着头皮也能读下来,何况美国人民数学不好。于是我就又加了一个专业,就是这个ACMS。这个时候,我有了两个专业。所以大家在学一个专业或者课程前,千万不要根据自己过去的经历给自己下定义,为什么呢?因为我发现我自从选择了这个专业,要逼迫自己开始学数学的时候,我渐渐发现学数学真的很有意思。数学前几门入门课,都是几百人上的,里面鱼龙混杂,拿个高分不难。这种“假高分”就让我觉得学得挺有成绩感的。成就感真的会成就你对一个事物的兴趣的。后来上了高级别的课程,每个班级只有30个人的时候,那个时候的30个人都是真正的数学专业的,GPA比较难拿。但是因为尝试过,也比较喜欢,所以那个时候学习数学就是兴趣为先,GPA次要。现在有的时候,真的再想,当年应该学门物理课的,没准我现在就是物理专业了。后来我是怎么又学了统计学呢?我大一结束的时候,去找ACMS的顾问,也就是advisor,讨论选课的事情。她看我上课上得蛮快的,说现在有一门叫做数理统计学的课程,是开学后秋天开始上,挺好的,问我想不想上。我当时想,什么是统计。我其实那个时候连statistics这个单词都要反应半天。就和advisor讲我还是不上了,因为不知道是什么。这个advisor超级热心,说这课报的人比能接纳的人多,而且一年一次,趁还有空余位置,就把我加进去,等我上了第一节课,再决定放不放弃。然后我一听,也好啊,反正没损失。之后就在2010年的秋天上了人生中第一门真正意义上的统计课。当时之所以没有在第一天扔掉这门课,就是发现想上这课的人真的好多好多,但是大部分都不能如愿,还要等一年才能上,自己有种赚到的感觉。所以,学弟学妹们,一定要给你自己一个和陌生学科接触的机会。千万不要因为自己是文科生就觉得自己玩不了数字,也不要因为自己是理科生玩不了文学。一定要尝试,选专业如此,今后的路更是如此。可能你给自己的这个机会能改变你的人生轨迹。我就想如果我当年没有遇到这个热心的advisor,没有决定在那节课上待下去,我现在可能正在发愁到底学不学经济学,或者转不转专业的问题。 2.关于选择几个专业:一定要精致,精致,再精致 我觉得我大学四年中,很遗憾的一件事情就是选择了三个专业。三个专业的好处是接触的知识多,范围广,找工作时候的对口工作多。但是对于大部分智商平常但又非常努力的童鞋们来说,弊绝对是大于利的。为什么呢?人的精力是有限的,做得多就意味着做不精。三个专业,又想拿好的GPA,就意味着每天的日子不是为了学知识活的,而是为了GPA而战的。这种学习方式,就是学不精致:只要学到考试点上,绝不深究。不是因为不想深究,而是因为另外一门专业还要时间去保住GPA。如果让我重新选择,我会在我大二的时候放弃掉经济专业。把ACMS的专业方向从数学经济改成OperationResearch,匀出些时间学统计专业里面的选修课程。还要匀出时间和教授做相关的research。这样自己统计方面的知识储备就更加完善。因为,对于一个真正想在统计学这条路上走下去的人来讲,本科阶段放弃了这种探究同领域不同方向的机会真的是很大的遗憾。尤其是对于统计学这种研究性专业来讲,在未来申请硕士和博士的时候,还是非常看重你本科的专业背景的。所以,如果你们找到了自己真正喜欢的专业,改舍弃的东西,一定要毫不犹豫地舍弃。千万不要图多,要精致,一定要精致。何况,现在想想,其实把一个专业学精致了,找到的工作只会好不会差。 3.零基础,入门统计学 在这部分中,我想根据自己大学中学习统计学的经验,介绍下如何在零基础的前提下完成统计学的入门。所以这部分的内容无论是对于本科阶段没有接触过统计的同学,还是小组中想了解这方面内容的前辈们都很适用。当然,如果你已经完成了本科阶段统计的学业,你可能是统计专业或者相关领域的研究生,PHD或者已经工作数年的职场达人,欢迎你来补充和critique我写的内容。下面我根据我的学习内容,把统计学入门应该学的基础课程分成数学部分,编程部分和统计部分三个部分加以罗列。每个建议的topic下我都列出了建议使用的书籍以及对应的Amazon上的地址,有一些我还列出了一些网上课程的资料,希望能够减少大家花在google上的时间。虽然我学统计的时候,是不得不用英文学习,我还是建议大家直接学习英文课本。按照我周围人大部分人的经验来看,英文描述学术方面的语言更加简练易懂。总之,下面的书也都有中文译本,大家根据自己的实际情况选择最适合自己的方法就好。
A:数学部分:以下内容按照顺序学习就好解析几何和微积分教科书是Stewart写的Calculus数学逻辑DanielJ.Velleman的HowToProveIt:AStructuredApproach基础微分Boyce-DiPrima的ElementaryDifferentialEquationsandBoundaryValueProblems矩阵代数及其应用DavidPoole的LinearAlgebra:AModernIntroduction实分析Taylor的AdvancedCalculus线性代数JohnH.Mathews的NumericalMethodsUsingMatlabMIT的LinearAlgebra公开课
B:计算机编程部分:没有必然的先后顺序之分JAVA关于使用哪个平台,我不是expert,大家问问周围的专业人士们,然后告诉我,我来更新。我使用的是jGRASP。这个应该是最常用的了。因为自己当初学JAVA就是应付差事(大家千万别学我)。其实很多学习CSE的同学喜欢eclipse,更方便。教科书是使用的Reges和Marty的BuildingJavaPrograms:ABacktoBasicsApproach这本书也是UofWashington的两门基础JAVA编程课,CSE142和CSE143,的教科书(非必买)。先上完142成绩合格了才能上143。这个两个课程的网站对外是公开的。真的是非常好的课程。我也看过很多JAVA的课程和公开课,这两门课程无论是从质量和难度上,绝对是JAVA课程中的上品。你如果认认真真完成了每个作业,即使是对于计算机专业的同学,也是非常大的提高。这两节课最初就是由教科书的两位作者上的,虽然说Marty现在抛弃了UW去了Stanford,我还是怀念他四年前给我上这门课的场景。Reges也非常非常非常棒,我的第二门课是跟他的。他是那种能把编程这么无聊的事情讲成非常浪漫的事情的教授。他现在还是在UW为了这个课程的发展而拼搏。CSE142CSE143R语言:统计学中最重要的工具,没有之一我最早用的就是CRAN的发布的R语言环境现在用的是RStudio,好用太多,强烈推荐大家去下这个。讲R语言的书很多很多,每本书都有它存在的闪亮点。我觉得有机会应该具体讨论下R语言的学习。根据我的感受,看书绝对不是学习编程的最佳方式,但是绝对是最笨的方法。编程是作为工具存在的。非CS的同学,在学习编程方面要功利些,也就是有针对性地学习:有用的学,没用的就没有必要钻研(当然,如果日后打定主意走上统计这条不归路的时候,还是要深入学习,比如我)。这里有几本我觉得蛮有用的书籍。大家千万不要掏腰包买,下载就好(我不能这么误导,但是真心觉得这种工具书,不值得买啊)RforDummiesRinaNutshellMichaelJ.Crawley的TheRBook(这本书的中文版年末或者明年年初上架,问我为什么知道?因为我和另外几名战友在翻译这本书)看来真有必要好好细致讨论下如何学习R:)MatlabMatlab据说在淘宝上可以买。在米国的话还要买正版,还好是学生价,99刀,虽然也不便宜,但是和非学生价相比,我实在是谢天谢地。话说在国外的同学们,还是能用正版尽量用正版。我有认识人被抓住罚了2500大洋就是因为用学校网络下载盗版windows。虽然非常少发生,但是一旦发生了的话,2500大洋在美国能买25套windows正版系统了。Matlab实在没有什么好的书推荐,因为我只是在学习线性代数的时候使用Matlab。平时都是使用R。但是有一个手册比较好,这里下载。我当时学习matlab的时候就是靠它还有google写的作业。加上上面线性代数里面推荐的那本Matlab的书籍,应该够用了。LaTex写作业必备神器。大家不用专门买书的,其实google和LaTex网上的一些手册就够了。如果真的想系统学,Helmut和Patrick合著的GuidetoLATEX还是不错的。还有介绍个LaTex模板的网站,我感觉这个更常用些,我们的作业都是靠这个模板弄的。
C:统计学学习部分这部分开始真正意义上介绍和统计核心课程相关的学习内容。和与数学部分不同,这部分中的学习完全可以和我在计算机编程部分中讲的知识相互贯穿来学的。尤其是R语言的学习,对统计的了解和学习是及其有帮助的。这个是重中之重。其实数理统计本身并不是多难,稍微有一些数学微积分基础的同学,掌握这部分内容应该非常快,但是想掌握扎实并且灵活了,非常难。好比说统计学中最基础的一个概念:平均数。不学统计的同学们也知道,平均数就是把所有的数据相加除以数目。但是学了数理统计的童鞋们,如果你们对平均数的概念就只是这样,那你们真的应该好好翻翻书再复习下了。初中老师讲平均数的时候,还讲了中数,除了这些还讲了条形图,扇形图等各种各样的图。为什么要讲这些?为什么要讲平均数?其实在这个阶段,就是为了教你如何直观地观察数据,让你对数据有个直观的把握。后来我们学了variance,就发现,原来描述数据的时候,mean不准确,我们要结合variance才能更准确地明白数据。之后又有结合参数来讲mean。简单的算术mean和为了衡量参数而衍生出来mean有着不同的意义。这个mean可以用maximumlikelihoodestimator求得,也可以用methodofmoments求出。不同的distribution有mean,randomresampling中有mean,做regressionanalysis的时候要用mean,连做statisticalinference的时候还是要用到mean。Mean真是无处不在。虽然说这些定义还算是基础,但是非常容易搞混,一旦搞混了,你接下来的很多东西都不能学了。每天积攒点糊涂了,几个月下来就真的糊涂了。这里推荐大家一本书Larsen的IntroductiontoMathematicalStatisticsandItsApplications(5thEdition)他还配套一本参考答案,不过这本答案只有课后题的奇数题目的答案,偶数题目的答案只有教师用书上有。如果不会的话,只能google。StudentSolutionsManualforIntroductiontoMathematicalStatisticsandItsApplications这本书算是我见过的所有的数理统计学书中最最简单直白的了,他前面一二章讲的是非常基础的概率知识,然后徐循渐进到较难的部分。整本书将近千页,但是对大家的数学水平并没有很高的要求,只要微积分基础还算是扎实,稍微知道点实分析中的分散和收敛就可以了。不过,这本书信息量也非常大,覆盖的内容也很广。我学数理统计学的时候,就是用的这本,连续三个学季,也就是9个月才把这本书从第一页学到了最后一页。到了后来学习更难的课程的时候,还要经常翻书来温故而知新,也可见本书对日后的学习有多重要了。这里我给大家分享下我学习这本书的心得,希望对自学的童鞋们有些帮助:1).这本书最重要的是所有黑字的定义和公式。一定要把它们理解清楚了。包括大写的X和小写的x的具体定义,这些都要区分清楚。什么是value和randomvariable,什么是estimator和estimates。统计中这种看着一样的概念很多,要区分;2).每道例题都要仔细弄懂,因为那些题目都非常有典型性。各种的经验和教训不断教育了LZ这些例题对日后学习有着非同寻常的意义;3).如果有时间,大家可以试着做下课后练习,可以帮助你更好地理解概念。我觉得这些联系不但要做,而且在没有到最后关头,不能看答案,最好能和人一起讨论下,这点应该对在校统计专业的弟弟妹妹们的一个基本要求;4).如果很忙,非要给这本书分个层次的话,前12章是必学,最后两章可以选学:a.一章到四章是最基础的部分:i.其中一章到三章是基础中的基础;ii.第四章开始讲分布。对于分布,大家应该了解的内容,可以见我们组里面发起的那个活动上面的内容,对于统计专业的童鞋,这些内容都是要大家融化在血液中的;b.第五章是在第四章的基础上建立展开的,讲estimation。通过这章,大家对分布中的estimator的性质会有一个更立体的了解;c.第六到第九章是讲statisticalinference,这个是日后大家学统计学用到的最多的东西;d.第十章到第十二章是讲基础的regressionanalysis和AVOVA。如果大家以后有机会做dataanalyst方面的工作,做dataprediction少不了regression,但是那个时候混合着其他概念,会更加复杂;e.最后两章是experimentaldesign和nonparametricstatistics,这些都更加接近现实生活一点,就是在不知道现有数据分布和参数的情况下,如何做统计分析。当然讲得也非常浅显。所以整体来讲Larson的这本书比较基础,但是每章之间的衔接非常紧密,这点应该和我一会儿推荐的书有所不同。那本书可能前面某章不懂,后面的章节还能明白,这本书一旦有一点知识弄不清楚了,后面的跟着也就不清楚了。下面就推荐下这本,建议有一定理论基础的和统计专业的同学看看,是Edward的ModernMathematicalStatistics这本书没有Larson的讲得广,比如regression的部分根本没有提。但是这本书中每个topic的讨论都深入很多。比如methodofmoments,Larson的书里面只花了2页提了一下概念和对应的简单的而应用,但是这本书用了12页的内容讨论。这本书可以作为Larson的补充来学习。基础数理统计最后要学到什么程度就说明你学得算是扎实可以进行下一部分的学习了呢?就是给你一篇统计学的paper,你可以根据paper中的逻辑,把他的演绎过程再自己演绎一遍,并且在不翻书的情况下,能说出每步的逻辑原理并加以描述论证。 4.回归分析regressionanalysis及其应用 在数理统计的脉络疏通的前提下,可以开始学习回归分析。根据自己和周围人的感觉来看,从这部分开始就比较地抽象。不像是数理统计,即便不明白,仔细钻研几天还能弄明白。回归分析最大的难点是,本身就是非常抽象,因为涉及到矩阵分布的内容,加上对数理统计的功底深,要是任何一点不扎实,这部分肯定越学越崩溃(真的是要用崩溃二字形容)。此外还建议大家好好学习线性代数的内容。我上文也有讲,还有推荐的公开课。首先大家要弄清楚最基本的scatterplot,很多人觉得这个太简单了,没人重视,实际上scatterplot可以帮助你对regression有个大体的感觉。你通过学习这部分,知道了什么是outlier,知道了不同的correlationcoefficient大体对应的图的形式,知道了给你很多数据,你是怎么把那条回归线画出来的。通过学习这种是geometricsense的概念,才容易理解simplelinear和multiplelinearregression这种datasense的抽象事物。还是先推荐几本书:DouglasC.Montgomery的DesignandAnalysisofExperiments和Sanford的AppliedLinearRegression(WileySeriesinProbabilityandStatistics)前两本都是很传统的讲线性回归的书籍,无论从内容还是从结构上来看。其中Sanford的更加基础。但是,我最推荐的是Freedman的StatisticalModels:TheoryandPractice虽然这本书很便宜,但是它真的是物有所值。和很多的学究派的教科书不同,如上面两本,这本书本身是可以拿来当小说读的,语言非常口语化。读的时候,本身就有感觉是Freedman在亲自给你授课。这本书前半部分是讲回归的,很有特点的是书后面很大的篇幅是书中所提到的论文的原文,这样非常便于你随时查找相关论文的原文从而便于你理解。线性回归很多时候单讲理论的东西,非常晦涩难懂,但是一旦有一个实例,就非常容易理解了。而且本书的附录里面附有大部分难题的答案。还有matlab的code,相信想学matlab的童鞋可以参照这本书来学习。即学习了程序,也学习了统计,一举两得。这本书唯一的一个缺点是,内容过于精炼,所以可能学习来要查很多的资料才能够明白,不过前两本材料是很好的辅助材料。线性回归还是选取难点的教材比较好,因为是从上层来观察下层建筑,这样比较方便了解自己漏的部分。而且相信这本书语言的通俗性,也能让读者更清晰地领会到所需要明白的重点内容。再说下Freedman,本身就是位统计学界德高望重的老爷爷。他是UC-Berkeley的统计学教授,发展了Bayesians和Bootstrap。相信学MachineLearning的同学都听该听说过他。他把统计学的研究拓展到了经济学,医药学,流行病学等等。这本书是2005年出版的,也是在他2008年去世前三年出版的,也应该算是糅合了他所认为的回归分析中最精华的内容。 5.R语言的学习 原本上面已经提到了R语言,但是因为R作为一个工具的存在,可以让你更好地理解统计分析。我和周围的同学都没有刻意地去学习R语言。因为我们的作业都是需要用R完成的,所以为了写作业,我们都逼迫自己在写作业的时候去学习R。但是,请大家务必把教课书中的Rcode弄明白。主要的学习途径有这么几个:1).labsection的Rnotes。教授的讲义和TA的讲义中所有用R的地方都会在Labsection上重新演绎一次,我也会私下里再把Rcode重新compile一次;2).做作业和讨论。感觉讨论在统计学中还是很重要的。一个好的统计专业学生,不但是做题好的,写code好的,更重要的是交流好的。好的交流着才能在交流过程中碰撞出解决问题的途径。同样,和同学讨论code才能帮助你理解。3).Rhelp和google。之前介绍了统计基础学习,相信如果大家按照上面的方法自学,应该会有一个不错的统计基础。但是对于大部分同学,学统计不是单纯地为了背概念和推公式。我一直都是喜欢应用性和实践性强的东西,这是统计的魅力所在。学了就能用。和很多生统和统计界的人聊过,他们说对于大多数专业来说,学到PHD学位,真正工作(如果不搞学术)中用到的东西很少很少。但是对于统计和生统专业来说,学校学习到的90%的知识都会在工作中直接应用。好了,不扯这么多了,这章主要介绍下统计后期学习的各个分支。其中很多方面,我也是只有些接触,了解真的不是非常多。毕竟作为小本刚毕业的我知识有限,我就是尽量把我知道的资源推荐给大家。我也尽量不出错误,十分欢迎大家批评拍砖讨论。a.运筹学至今为止,感觉到统计学分支之下或者相关的科目中上过的比较有意思的科目之一。一般本科阶段没有这个专业的设置,只是有选修课程或者方向。到了研究生阶段才会有单独的专业或者是单独的研究方向。但是据说单纯靠运筹徐就业得话,形势不是很好。但是,我总是觉得就业是看个人的,再差的专业,人优秀也能找到好的职位;再好的专业,也有出来找不到工作的孩纸。其实从我对统计学的理解来看,我觉得运筹学蛮像哲学的,讲的就是在资源有限的前提下如何更好得分配资源,或者是在复杂的情况下,用什么样的方式能够解决问题。所以上运筹学的课程,乐趣是在于解决问题。当时上课的时候,做过两个project。一个是关于线性规划,另一个是关于MarkovChain的。线性规划的课题设计是关于学校餐厅的配餐设计。当时找了50多种食材原料还有比较大众的零食,搜集了它们的价格和营养成分。营养成分包括卡路里,蛋白质,维生素什么的。目的是根据不同人群对食品的需求,比如肥胖人士,严格素食主义者,糖尿病患者,gluten过敏人士等等,在这些要求下什么样的配餐能把价格压到最低。MarkovChain的课题做的非常有意思,应该算是我大学阶段最有创造性的课题了:就是用MarkovChain作曲。当时找了我们学校音乐专业的学生用钢琴弹曲子。然后我们把每个曲子按照开头,中部,和结尾剪成三段相同长短的clip,再传送到java里面,通过改变transitionmatrix找到最合适的概率,演奏音乐。因为实在没有时间,只有两周,所以transitionmatrix是手工试的,否则应该有更好的方法。强烈推荐一本针对运筹学的书:OperationsResearch:ApplicationsandAlgorithms这本书涵盖了所有的operationresearch的topics,读起来算是直白清楚。不深,但是面广,对于想直观了解运筹学的孩纸是除了wiki以外最好的方式。下面是三个运筹学的方向。上面那本书中其实都有讲,只是下面单独讲就更深入些。每个方向都有无数本书可以看。但是那些书大部分深奥难懂,还不如笔记清晰。如果在上面的书看了后,大家还有兴趣,下面是一些笔记可以看看。LinearProgramming的笔记Non-LinearProgramming的笔记DiscreteOptimizationb.Stochastic:运筹学下的一个分支,但是还是想单独说第一次接触stochastic是在大二的时候上经济学系下面的两门金融课程。当时我还在上人生中第一门统计课,其实那个时候除了概率其他的都懵懵懂懂的。Stochastic,当时选这课是因为stochastic和stock在写法和发音上面都很像。觉得stochastic就是讲股票投资的。后来才知道stochastic是随机性。但是不管怎么说,歪打正着学了个统计相关的课程。这里想说个关于我对统计的感觉。从上面写的,大家知道我第一个确定的专业是经济。我属于凡事爱往复杂想的那种。其实这种性格的人,在学经济这种socialscience的初期是非常痛苦的。为什么呢?比如我大学第一个学期学的基础微观经济学,书里提到GDP。我就想GDP怎么算的啊,国家那么大怎么能保证这个GDP准确呢?然后书里出现失业率,计量经济学公式,书中种种事物,我都会质疑半天,最后自己就只好死记硬背,因为觉得所有的东西都讲不通。直到学了统计学以后,才了解到sample,survey和experimentsdesign在socialscience的应用,也了解了计量经济学中的统计原理,才觉得经济书上的东西有理可依有据可循。所以说,统计还是一门很答疑解惑的学科。学了统计学,就可以相对容易地掌握很多其他学科的内容。可能鉴于每个人学一门学科都是这种感觉:没有基础,学上层建筑是空的。所以,一般学习stochastic是先学习统计基础理论,再放回到金融理论中学习。或者很多人和我一样,先学的金融理论,再学习统计基础。我觉得哪种方法都有它好的一面和不好的一面吧,这个就要看个人了。统计学中对Stochastic最有帮助的几个知识要点:1).概率和条件概率:不多说,所有学科的基础;2).PoissonDistribution;3).Randomwalk,MartingalesandBrownianmotion(密集型恐惧症慎入);4).MarkovChain:大家见“运筹学”;5).Stationaryprocesses。经济学、金融学中的Stochastic的应用:Black-ScholeZivot的部分关于stock的笔记虽然stochastic接触不少,但是真正深入的没有怎么学,都是基于统计学的。书就没有什么推荐的了。欢迎专门学这个的同学在小组中分享你的心得。大家如果对Stochastic方面真的非常有兴趣的话,不防看看CFA的教材。如果有机会,也可以选学金融工程方面的课程。应该还是很有意思的。未完,前几天LZ有点小忙,这几天还在更新高级课程方面的学习和统计专业延伸课程的学习。写这部分,真的感觉自己力不从心。我果真是个小本,真的往某个领域深入了讲就没什么太多的可讲了。所以,大家还是好好学习,天天向上吧,技多不压身,何况自己的专业。(注:本文有一定删减和改动)
点击展开全文
悄悄告诉你
更多同类文章
还可知道有多少人阅读过此篇文章哦
阅读原文和更多同类文章
可微信扫描右侧二维码关注后
还可知道有多少人阅读过此篇文章哦
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
您的【关注和订阅】是作者不断前行的动力
本站文章来自网友的提交收录,如需删除可进入
删除,或发送邮件到 bang@ 联系我们,
(C)2014&&版权所有&&&|&&&
京ICP备号-2&&&&京公网安备34

我要回帖

更多关于 本科统计学考研方向 的文章

 

随机推荐