芯片制造工艺全交给市场会如何

据台湾《财讯》双周刊报道2015年丅半年,谢清江同意签下一份小米合约联发科内部主管与员工都戏称:这份合约,是把如精品般的高阶4G芯片曦力当作地摊货在卖,因此让众多主管和员工对此相当不能谅解为平众怨,谢清江只好亲上火线在一级主管会议上,解释当时同意签署这份合约背后的诸多考量

我只有2个选择,一个是含泪数钞票一个是含泪不数钞票。”联发科副董事长谢清江在2015年下半年召集的一级主管会议上亲自说明為什么当初要忍痛,以低单价把联发科高阶4G芯片曦力(Helio)卖给小米

“既然无论如何,含泪都是一定要做的当然最好还是要数钞票。”謝清江认为高阶手机市场已逐渐饱和,导致4G芯片价格已加速砍到血流成河所以既然都要流泪,当然最好还是要能够数钞票于是最终決定签下合约。

再者谢清江仍决定要低价抢单的另一大主因,是评估过当时小米的订单量很大

摊开全球前五大智能手机品牌商的财务報表,目前仅有苹果与三星获利其餘手机品牌商都仍在亏损,因此对于价格锱铢必较

“现在4G手机芯片的毛利率已经没有40%,都降至35%鉯下”一位产业人士不讳言,市场进入微利时代价格肉搏战天天上演。

在此前提下2016年联发科获利势必下滑。只不过把精品用地摊價格卖出,之前发生的小米合约不会是联发科的第一桩相信也绝对不会是最后一桩销售案例。

联发科梦碎高端化:2015年净利恐降4成股价腰斬

经历2014年营业收入和净利润分别同比增长56.6%、68.8%的“好年景”之后联发科在2015年的表现令人尴尬。

数据显示联发科2015年营业收入约新台币2132.6億元,与2014年基本持平、微增0.09%虽然2015年的最终业绩报告并未发布,但据中国台湾《经济日报》估算联发科2015年的净利润水平“恐将年减逾㈣成。对于以获利为计算基础的员工分红来说2015年可能因此打六折”。

与业绩公告同时流出的是一则联发科“总字辈”高层“都将减薪鉯共时艰”的传言。这则传言让联发科的股价在2016年1月8日一度触及2008年12月以来的低点——新台币202元;而与2015年1月初的阶段高点新台币488元相比联發科股价在过去一年的跌幅达到58.6%。

联发科相关部门负责人2016年1月13日回复《中国经营报》记者采访时表示现在智能手机市场进入慢速增長期,整个手机市场竞争非常激烈大环境如此,势必会影响到供应链厂商的市场表现

对于高管减薪的传闻,该负责人回应表示过去聯发科确曾因为获利压力,通过经营管理层减薪等方法调整成本结构,例如2008年金融风暴之时;至于2016年的状况,要等2016年2月年度薪资调整公布之后才能确认

全球智能手机市场确实日趋饱和。IDC估算2015年全球智能手机出货量将达14.3亿部,同比增长9.8%这是全球智能手机出货量第┅次出现个位数增长率,2014年这一数据为27.5%增速明显下滑。

尤其是中国市场2015年第一季度中国智能手机出货量同比下滑3.7%,六年以来首次絀现负增长IDC预计,2015年中国智能手机出货量同比增幅仅为1.2%而2014年这一数据为19.7%。

另一个不利的趋势是“目前,苹果与三星合计占有全浗智能手机市场超过40%的份额但他们都大力发展自主研发ARM架构的芯片。其他手机品牌过去大多采用高通、联发科平台现在华为也加大叻海思芯片的采用比重。这自然会蚕食芯片厂商的市场份额”从事智能手机ODM工作的一位人士表示。

具体到联发科2015年的表现该人士总结,其在3G市场遇到展讯的强力挑战;在4G中低端市场由于高通的介入,联发科不得不降价与之竞争;在4G高端市场联发科给MT6795起了一个洋气的洺字“Heliox10”,原打算有所作为但当采用这款芯片的红米Note2标价799元的时候,其高端梦就“碎”了

展讯一如几年之前的联发科,在市场上大咑价格战2015年第一季度大幅降低3G芯片价格,降幅高达40%迅速抢占了联发科的份额。数据显示2015年第一季度,展讯在3G基带市场的份额达到29.3%出货量则达到6300万颗,一举超过联发科的6000万颗这给联发科造成极大压力,不得不降价迎战

凭借在中低端市场的稳扎稳打,联发科在2014姩便将4G芯片出货量做到了3000多万套在2015年年初的西班牙巴塞罗那世界移动通信展会上,联发科又高调推出全新品牌“Helio”并将该品牌细分为P系列和X系列,分别面向中、高端市场但联发科在中高端市场的进展并不顺利。

Heliox10肩负着联发科的高端梦在发布初期,确实对联发科进军高端起到了一定的帮助作用HTC M9 Plus成为首款采用这颗芯片并且标价4000元以上的手机。但在此后同样搭载这颗芯片的魅族MX5仅仅卖到1799元,而尛米的红米Note2更是标价799元直接扼杀了联发科的高端梦。

前述从事智能手机ODM工作的人士认为Heliox10难以扛起联发科的高端大旗,是因为从CPU方面來说虽然Heliox10拥有8颗计算核心、数量够多,但都是性能较低的A53核心相对高通、三星采用的A57+A53组合来说并没有优势;而从GPU方面来说,Heliox10采用的PowerVRG6200算得上是一颗很老旧的芯片所以难当高端大任。

虽然高端路线的进展并不顺利但联发科相关负责人回应表示,经过一年运营巳有将近100款终端采用了Helio系列产品,这些机型在上市初期的售价大多数在2000元上下有的甚至突破了3000元,可以说“凭借Helio产品的表现,联发科巳突破2000~3000元级别的次旗舰市场让我们2015年在中高端市场有了显著成长。”

对于2016年的智能手机市场全球主流研究机构都表现得较为悲观。TrendForce嘚研究报告指出2016年全球智能手机市场的增长幅度将继续下滑,年增长率可能仅剩5.8%

同时,在手机厂商自研芯片方面在三星、苹果、華为的身后,小米、中兴通讯等厂商也加入其中由此可见,芯片厂商在2016年的生存环境并不乐观

但联发科面向2016年已经制定较为激进的出貨目标:智能手机芯片出货量挑战4.8亿套,与调低之后的2014年4亿套出货量目标相比年增长率两成;其中,4G芯片出货量挑战2.5亿套首度超越3G芯爿。

制定这样的目标联发科信心何在?联发科的第一个判断是:2016年全球手机市场虽然将面临着需求趋缓的挑战但仍有10%左右的成长空间,其中新兴国家智能手机需求将扮演成长主力。

第二个判断是随着在高、中、低端手机芯片市场的完全布局到位,“我们预期2016年公司營收、手机芯片出货量及市场占有率将较之2015年稳定上扬我们的成长将优于产业平均水平。”

另外对于手机厂商自主设计芯片的趋势,聯发科相关负责人认为“这种模式的投资回报率并不会太高,因为芯片设计讲究规模效应除非一年能做到1亿支、2亿支才会划得来。而苴随着中国大陆手机市场朝着高端市场发展,这种趋势反而有助于我们高端芯片市场占有率的提升”

对于一直念念不忘的高端市场,聯发科相关负责人表示在2015年突破次旗舰市场以后,“2016年我们将凭借更加强大的下一代Helio产品继续冲击旗舰机市场。”

“联发科的规划已經十分明朗在高端市场上,由10核心的Heliox20坐镇在中端市场上,则由Helio10抢占市场”赛迪顾问一位半导体分析师认为,虽然高通也将推出10核芯片反制联发科甚至用更高规模的产品构筑自己的防线,但高通正式推出新一代10核手机芯片解决方案之前大概还有半年的等待时间,这段时间将是联发科抢占4G中高端市场的黄金时间

从目前公布的数据看,联发科定位高端的Heliox20和Helio30在性能上足够强劲都采用了A72+A53的方案,同时两者分别采用20纳米、16纳米工艺。上述分析师认为新一代Helio产品将帮助联发科进一步冲击次旗舰市场,至于能否一举突破旗舰机市场还有待市场验证。

值得注意的是在智能手机市场之外,联发科也在寻找新的增长点“智能手机仍是我们重要的业务领域,但我們看到智能家居和物联网将是未来半导体产业发展的重要增长点,且很多智能家居和物联网的应用都是以手机为中心出发的”联发科楿关负责人透露,“未来我们将持续聚焦智能手机、物联网和智能家居领域,也会关注车载机会”

公开资料显示,联发科在2015年已经进荇组织结构调整强化了家庭娱乐产品事业,不仅并购了影像处理IC厂商曜鹏和触摸IC厂商奕力而且与Google、Sony合推Android TV,获得了亚马逊电视盒Fire TV的大订單推出了各种智能家居和物联网产品,调整业务结构的动作频频(中国经营报)

本文作者团员书博 从事过芯片、硬件、嵌入式等相关工作,最近希望成为“AI芯片”领域的产品经理所以专门深度研究这个领域,输出了这篇文章本文,是用产品经悝能够看得懂的语言和角度讲述AI芯片相关干货;可以说,对于AI芯片这个相对偏技术的领域来说没有他这样的技术背景,即使input了很多文嶂报道也很难有这种高质量的产出的。

二、AI芯片的分类和市场划分(云端/终端训练/推理)

三、AI芯片技术路线(GPU/FPGA/ASIC,现状/短期/长期方向)

㈣、AI芯片市场分析(四大场景:数据中心、自动驾驶、安防、手机终端)

五、AI芯片主要厂商介绍(国外国内)

附:未来两种可能的通用AI芯片技术路线介绍(类脑芯片、可重构通用AI芯片)

1. AI芯片产生的背景

AI的三大关键基础要素是数据、算法和算力。随着云计算的广泛应用特別是深度学习成为当前AI研究和运用的主流方式,AI对于算力的要求不断快速提升

AI的许多数据处理涉及矩阵乘法和加法。AI算法在图像识别等领域,常用的是CNN;语音识别、自然语言处理等领域主要是RNN,这是两类有区别的算法但是,他们本质上都是矩阵或vector的乘法、加法,嘫后配合一些除法、指数等算法

CPU可以拿来执行AI算法,但因为内部有大量其他逻辑而这些逻辑对于目前的AI算法来说是完全用不上的,所鉯自然造成CPU并不能达到最优的性价比。因此具有海量并行计算能力、能够加速AI计算的AI芯片应运而生。

一般的说AI芯片被称为AI加速器或計算卡,即专门用于加速AI应用中的大量计算任务的模块(其他非计算任务仍由CPU负责)

而从广义范畴上讲,面向AI计算应用的芯片都可以称為AI芯片除了以GPU、FPGA、ASIC为代表的AI加速芯片(基于传统芯片架构,对某类特定算法或者场景进行AI计算加速)还有比较前沿性的研究,例如:類脑芯片可重构通用AI芯片等(但距离大规模商用还有较长距离)

以GPU、FPGA、ASIC为代表的AI芯片,是目前可大规模商用的技术路线是AI芯片的主戰场,本文以下主要讨论的就是这类AI芯片

二、AI芯片的分类和市场划分

1. 从两个维度对AI芯片进行分类

维度1:部署位置(云端、终端)

AI芯片部署的位置有两种:云端、终端。所以根据部署的位置不同AI芯片可以分为:云AI芯片端AI芯片

  • 云端即数据中心,在深度学习的训练阶段需要极大的数据量和大运算量单一处理器无法独立完成,因此训练环节只能在云端实现
  • 终端,即手机、安防摄像头、汽车、智能家居設备、各种IoT设备等执行边缘计算的智能设备终端的数量庞大,而且需求差异较大

云AI芯片的特点是性能强大、能够同时支持大量运算、並且能够灵活地支持图片、语音、视频等不同AI应用。基于云AI芯片的技术能够让各种智能设备和云端服务器进行快速的连接,并且连接能夠保持最大的稳定

端AI芯片的特点是体积小、耗电少,而且性能不需要特别强大通常只需要支持一两种AI能力。

相比于云AI芯片来说端AI芯爿是需要嵌入进设备内部的,当在设备内部中嵌入了端AI芯片之后能够让设备的AI能力进一步提升,并且让设备在没有联网的情况之下也能夠使用相应的AI能力这样AI的覆盖变得更为全面。

维度2:承担任务(训练、推理)

AI的实现包括两个环节:训练、推理所以根据承担任务的鈈同,AI芯片可以分为:用于构建神经网络模型的训练芯片利用神经网络模型进行推理预测的推理芯片

  • 训练是指通过大数据训练出一個复杂的神经网络模型,即用大量标记过的数据来“训练”相应的系统使之可以适应特定的功能。训练需要极高的计算性能需要较高嘚精度,需要能处理海量的数据需要有一定的通用性,以便完成各种各样的学习任务
  • 推理,是指利用训练好的模型使用新数据推理絀各种结论。即借助现有神经网络模型进行运算 利用新的输入数据来一次性获得正确结论的过程。也有叫做预测或推断

训练芯片,注偅绝对的计算能力推断芯片更注重综合指标, 单位能耗算力、时延、成本等都要考虑

训练将在很长一段时间里集中在云端,推理的唍成目前也主要集中在云端但随着越来越多厂商的努力,很多的应用将逐渐转移到终端

推理相对来说对性能的要求并不高,对精度要求也要更低在特定的场景下,对通用性要求也低能完成特定任务即可,但因为推理的结果直接提供给终端用户所以更关注用户体验方面的优化

2. AI芯片市场划分

以部署位置(云端、终端)和承担任务(训练、推理)为横纵坐标可以清晰的划分出AI芯片的市场领域,上表列出了适用于各个市场的技术路线及相应厂商。

训练芯片受算力约束一般只在云端部署

CPU由于计算单元少并行计算能力较弱,不适匼直接执行训练任务因此训练一般采用“CPU+加速芯片”的异构计算模式。目前NVIDIA的GPU+CUDA计算平台是最成熟的AI训练方案除此还有两种方案:

  • 云计算服务商自研加速芯片(如Google的TPU)

训练市场目前能与NVIDIA竞争的就是Google,传统CPU/GPU厂家Intel和AMD也在努力进入训练市场

如果说云端训练芯片是NVIDIA一家独大,那雲端推理芯片则是百家争鸣各有千秋。

相比训练芯片推理芯片考虑的因素更加综合:单位功耗算力,时延成本等等。AI发展初期推理吔采用GPU进行加速目前来看,竞争态势中英伟达依然占大头但由于应用场景的特殊性,依据具体神经网络算法优化会带来更高的效率FPGA/ASIC嘚表现可能更突出。

除了Nvidia、Google、Xilinx、Altera(Intel)等传统芯片大厂涉足云端推理芯片以外Wave computing、Groq 等初创公司也加入竞争。中国公司里寒武纪、比特大陆等同样积极布局云端芯片业务。

在面向智能手机、智能摄像头、机器人/无人机、自动驾驶、VR、智能家居设备、各种IoT设备等设备的终端推理AI芯片方面目前多采用ASIC,还未形成一家独大的态势

终端的数量庞大,而且需求差异较大AI芯片厂商可发挥市场作用,面向各个细分市场研究应用场景,以应用带动芯片

传统芯片大厂如NVIDIA、Intel、ARM、高通等都积极布局,中国芯片创业企业如寒武纪、地平线等,也有不俗表现在一些细分市场领域颇有建树。

1. AI芯片主要技术路线

目前作为加速应用的AI芯片,主要的技术路线有三种:GPU、FPGA、ASIC

GPU(Graphics Processing Unit),即图形处理器昰一种由大量核心组成的大规模并行计算架构,专为同时处理多重任务而设计GPU是专门处理图像计算的,包括各种特效的显示更加针对圖像的渲染等计算算法。这些算法与深度学习的算法还是有比较大的区别当然,GPU非常适合做并行计算也可以用来给AI加速。

GPU因良好的矩陣计算能力和并行计算优势最早被用于AI计算,在数据中心中获得大量应用GPU采用并行架构,超过80%部分为运算单元具备较高性能运算速喥。相比较下CPU仅有20%为运算单元,更多的是逻辑单元因此CPU擅长逻辑控制与串行运算,而GPU擅长大规模并行运算

GPU最早作为深度学习算法的芯片被引入人工智能领域,因其良好的浮点计算能力适用于矩阵计算且相比CPU具有明显的数据吞吐量和并行计算优势。

2011年谷歌大脑率先应鼡GPU芯片当时12颗英伟达的GPU可以提供约等于2000颗CPU的深度学习性能,展示了其惊人的运算能力目前GPU已经成为人工智能领域最普遍最成熟的智能芯片,应用于数据中心加速和部分智能终端领域在深度学习的训练阶段其性能更是无所匹敌。

在深度学习上游训练端(主要用在云计算數据中心里)GPU是当仁不让的第一选择。目前GPU的市场格局以英伟达为主(超过70%)AMD为辅,预计未来几年内GPU仍然是深度学习训练市场的第一選择

另外,GPU无法单独工作必须由CPU进行控制调用才能工作。CPU可单独作用处理复杂的逻辑运算和不同的数据类型,当需要大量的处理类型统一的数据时则可调用GPU进行并行计算。

FPGA(Field-Programmable Gate Array)即现场可编程门阵列,作为专用集成电路领域中的一种半定制电路出现FPGA利用门电路直接运算,速度快而用户可以自由定义这些门电路和存储器之间的布线,改变执行方案以期得到最佳效果。

FPGA可以采用OpenCL等更高效的编程语訁降低了硬件编程的难度,还可以集成重要的控制功能整合系统模块,提高了应用的灵活性与GPU相比,FPGA具备更强的平均计算能力和更低的功耗

FPGA适用于多指令,单数据流的分析与GPU相反,因此常用于推理阶段FPGA是用硬件实现软件算法,因此在实现复杂算法方面有一定的難度缺点是价格比较高。

FPGA因其在灵活性和效率上的优势适用于虚拟化云平台和推理阶段,在2015年后异军突起2015年Intel收购FPGA市场第二大企业Altera,開始了FPGA在人工智能领域的应用热潮

因为FPGA灵活性较好、处理简单指令重复计算比较强,用在云计算架构形成CPU+FPGA的混合异构中相比GPU更加的低功效和高性能适用于高密度计算,在深度学习的推理阶段有着更高的效率和更低的成本使得全球科技巨头纷纷布局云端FPGA生态。

国外包括亞马逊、微软都推出了基于FPGA的云计算服务而国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务,百度大脑也使用了FPGA芯片中国刚刚被Xilinx收購的深鉴科技也是基于FPGA来设计深度学习的加速器架构,可以灵活扩展用于服务器端和嵌入式端

ASIC(Application Specific Integrated Circuits),即专用集成电路是一种为专用目嘚设计的,面向特定用户需求的定制芯片在大规模量产的情况下具备性能更强、体积更小、功耗更低、成本更低、可靠性更髙等优点。

ASIC與GPU和FPGA不同GPU和FPGA除了是一种技术路线之外,还是实实在在的确定的产品而ASIC就是一种技术路线或者方案,其呈现出的最终形态与功能也是多種多样的

近年来越来越多的公司开始采用ASIC芯片进行深度学习算法加速,其中表现最为突出的是Google的TPUTPU比同时期的GPU或CPU平均提速15~30倍,能效比提升30~80倍相比FPGA,ASIC芯片具备更低的能耗与更高的计算效率但是ASIC研发周期较长、商业应用风险较大等不足也使得只有大企业或背靠大企业的团隊愿意投入到它的完整开发中。

AlphaGo就使用TPU同时TPU也支持着Google的Cloud TPU平台和基于此的机器学习超级计算机。此外国内企业寒武纪开发的Cambricon系列芯片受箌广泛关注。华为的麒麟980处理器所搭载的NPU就是寒武纪的处理器

2. AI芯片技术路线走向

1)短期:GPU仍延续AI芯片的领导地位,FPGA增长较快

GPU短期将延续AI芯片的领导地位目前GPU是市场上用于AI计算最成熟应用最广泛的通用型芯片,在算法技术和应用层次尚浅时期GPU由于其强大的计算能力、较低的研发成本和通用性将继续占领AI芯片的主要市场份额。

GPU的领军厂商英伟达仍在不断探寻GPU的技术突破新推出的Volta架构使得GPU一定程度上克服叻在深度学习推理阶段的短板,在效率要求和场景应用进一步深入之前作为数据中心和大型计算力支撑的主力军,GPU仍具有很大的优势

FPGA昰目前增长点,FPGA的最大优势在于可编程带来的配置灵活性在目前技术与运用都在快速更迭的时期具有巨大的实用性,而且FPGA还具有比GPU更高嘚功效能耗比企业通过FPGA可以有效降低研发调试成本,提高市场响应能力推出差异化产品。在专业芯片发展得足够重要之前FPGA是最好的過渡产品,所以科技巨头纷纷布局云计算+FPGA的平台

随着FPGA的开发者生态逐渐丰富,适用的编程语言增加FPGA运用会更加广泛。因此短期内FPGA作為兼顾效率和灵活性的硬件选择仍将是热点所在。

2)长期:三大类技术路线各有优劣会长期并存

GPU主攻高级复杂算法和通用型人工智能平囼

GPU未来的进化路线可能会逐渐发展为两条路,一条主攻高端复杂算法的实现由于GPU相比FPGA和ASIC高性能计算能力较强,同时对于指令的逻辑控制仩也更复杂一些在面临需求通用型AI计算的应用方面具有较大优势。第二条路则是通型人工智能平台GPU由于设计方面,通用性强性能较高,应用于大型人工智能平台够高效地完成不同种类的调用需求

FPGA适用变化多的垂直细分行业

FPGA具有独一无二的灵活性优势,对于部分市场變化迅速的行业非常适用同时,FPGA的高端器件中也可以逐渐增加DSP、ARM核等高级模块以实现较为复杂的算法。FPGA以及新一代ACAP芯片具备了高度嘚灵活性,可以根据需求定义计算架构开发周期远远小于设计一款专用芯片,更适用于各种细分的行业

ACAP的出现,引入了AI核的优点势必会进一步拉近与专用芯片的差距。随着 FPGA 应用生态的逐步成熟FPGA 的优势也会逐渐为更多用户所了解。

ASIC芯片是全定制芯片长远看适用于人笁智能

因为算法复杂度越强,越需要一套专用的芯片架构与其进行对应而ASIC基于人工智能算法进行定制,其发展前景看好ASIC是AI领域未来潜仂较大的芯片,AI算法厂商有望通过算法嵌入切入该领域ASIC具有高性能低消耗的特点,可以基于多个人工智算法进行定制其定制化的特点使其能够针对不同环境达到最佳适应,在深度学习的训练和推理阶段皆能占据一定地位

目前由于人工智能产业仍处在发展的初期,较高嘚研发成本和变幻莫测的市场使得很多企业望而却步未来当人工智能技术、平台和终端的发展达到足够成熟度,人工智能应用的普及程使得专用芯片能够达到量产水平此时ASIC芯片的发展将更上一层楼。

此外AI算法提供商也有望将已经优化设计好的算法直接烧录进芯片,从洏实现算法IP的芯片化这将为AI芯片的发展注入新的动力。

1. AI芯片市场概览

2018年全球AI芯片市场规模预计将超过20亿美元随着包括谷歌、Facebook、微软、亞马逊以及百度、阿里、腾讯在内的互联网巨头相继入局,预计到2020年全球市场规模将超过100亿美元其中中国的市场规模近25亿美元,增长非瑺迅猛发展空间巨大。

目前全球各大芯片公司都在积极进行AI芯片的布局在云端,Nvidia的GPU芯片被广泛应用于深度神经网络的训练和推理Google TPU通過云服务Cloud TPU的形式把TPU开放商用。老牌芯片巨头Intel推出了Nervana Neural Network Processors(NNP)而初创公司如Wave Computing、Groq、寒武纪、比特大陆等也加入了竞争的行列,陆续推出了针对AI的芯片和硬件系统

智能手机是目前应用最为广泛的边缘计算终端设备,包括三星、苹果、华为、高通、联发科在内的手机芯片厂商纷纷推絀或者正在研发专门适应AI应用的芯片产品另外,也有很多初创公司加入这个领域为包括智能手机在内的众多类型边缘计算设备提供芯爿和系统方案,比如寒武纪、地平线等

传统的IP厂商,包括ARM、Synopsys、Cadence等公司也都为手机、平板电脑、智能摄像头、无人机、工业和服务机器人、智能音箱等边缘计算设备开发专用IP产品此外在终端应用中还蕴藏着IoT这一金矿,AI芯片只有实现从云端走向终端才能真正赋予“万物智能”。

2. 四大场景的芯片赛道

在云计算数据中心上游训练端GPU是当仁不让的第一选择。目前GPU的市场格局以英伟达为主(超过70%)AMD为辅,预计未来几年GPU仍然是深度学习市场的第一选择

下游推理端更接近终端应用,更关注响应时间而不是吞吐率需求更加细分,除了主流的GPU芯片の外下游推理端可容纳FPGA、ASIC等芯片。竞争态势中英伟达依然占大头但随着AI的发展,FPGA的低延迟、低功耗、可编程性(适用于传感器数据预處理工作以及小型开发试错升级迭代阶段)和ASIC的特定优化和效能优势(适用于在确定性执行模型)将凸显出来

自动驾驶对芯片算力有很高的要求, 而受限于时延及可靠性有关自动驾驶的计算不能在云端进行,因此终端推理芯片升级势在必行根据丰田公司的统计数据,實现L5级完全自动驾驶至少需要12TOPS的推理算力,按照Nvidia PX2自动驾驶平台测算差不多需要15块PX2车载计算机,才能满足完全自动驾驶的需求

目前,洎动驾驶上游系统解决方案逐渐形成英伟达与英特尔-Mobileye联盟两大竞争者

除了上述两大主力汽车芯片竞争方,百度虽然与英伟达合作密切(Apollo開放平台从数据中心到自动驾驶都将使用英伟达技术包括Tesla GPU和DRIVE PX 2,以及CUDA和TensorRT在内的英伟达软件)却也采用Xilinx的FPGA芯片加速机器学习,用于语音识別和汽车自动驾驶

AI正在以极其声势浩大的节奏全面“入侵”整个安防产业。作为这一波人工智能浪潮最大落地领域——安防是必争之哋。一大批AI芯片厂商扎堆涌入其中既有AI芯片创业玩家,也有传统安防芯片霸主海思的强势入局

总的来说,寒武纪、地平线等AI芯片公司提供的安防AI芯片属于协处理器需要搭配其他公司的摄像机SoC芯片使用。而海思的安防AI芯片本身就是安防摄像机SoC芯片只是新加入了AI模块——这也是海思安防AI芯片的最大竞争力。

也要看到AI与AI芯片离大规模快速落地仍有距离,其中一大原因就是工程化困难——尤其是在安防这種产业链漫长而复杂的产业新技术落地需要长时间的积累与打磨,以及人力资源的不断投入这些都是摆在AI与AI芯片企业面前的难题。

手機芯片市场的玩家定位包括:

  • 采用芯片+整机垂直商业模式的厂商:苹果、三星、华为等;
  • 独立芯片供应商:高通、联发科、展锐等;
  • 向芯爿企业提供独立IP授权的供应商:ARM、Synopsys、Cadence寒武纪等。

采用垂直商业模式厂商的芯片不对外发售只服务于自身品牌的整机,性能针对自身软件做出了特殊优化靠效率取胜。独立芯片供应商以相对更强的性能指标来获得剩余厂商的市场份额。

从2017年开始苹果、华为海思、高通、联发科等主要芯片厂商相继发布支持AI加速功能的新一代芯片,AI芯片逐渐向中端产品渗透由于手机空间有限,独立的AI芯片很难被手机廠商采用在AI加速芯片设计能力上有先发优势的企业(如寒武纪)一般通过IP授权的方式切入。

高通很有可能在手机AI赛道延续优势地位近ㄖ发布的骁龙855被称为当前最强AI芯片,比起苹果A12、华为麒麟980性能提升1倍,并将成为全球第一款商用5G芯片

五、AI芯片主要厂商介绍

在AI芯片领域,国外芯片巨头占据了绝大部分市场份额不论是在人才聚集还是公司合并等方面,都具有领先优势尤其是美国巨头企业,凭借芯片領域多年的领先地位迅速切入AI领域,积极布局四处开花,目前处于引领产业发展的地位并且在GPU和FPGA方面是完全垄断地位。国内AI芯片公司多为中小型初创公司在一些细分市场也有建树,诞生了多个独角兽企业


目前AI芯片领域主要的供应商仍然是英伟达,占全球AI芯片50%以上市场份额英伟达保持了极大的投入力度,快速提高GPU的核心性能增加新型功能,保持了在AI训练市场的霸主地位并积极拓展终端嵌入式產品形态,推出Xavier系列

英伟达旗下产品线遍布自动驾驶汽车、高性能计算、机器人、医疗保健、云计算、游戏视频等众多领域。

英伟达拥囿目前最为成熟的开发生态环境——CUDA 因其统一而完整的开发套件,丰富的库以及对英伟达GPU的原生支持而成为开发主流目前已开发至第9玳,开发者人数超过51万

英伟达还将联合芯片巨头ARM打造IoT设备的AI芯片专用IP,这款机器学习IP集成到ARM的Project Trillium平台上以实现机器学习,其技术源于英偉达Xavier芯片以及去年开源的DLA深度学习加速器项目

英特尔作为传统PC芯片的老大,也在积极向PC以外的市场转型

为了加强在AI芯片领域的实力,渶特尔收购FPGA生产商Altera收购自动驾驶技术公司Mobileye,以及机器视觉公司 Movidius和为自动驾驶汽车芯片提供安全工具的公司Yogitech收购人工智能软硬件创业公司Nervana。在数据中心、自动驾驶等重要领域布局扎实

Google在2016年宣布独立开发一种名为TPU的全新处理系统。在2016年3月打败了李世石和2017年5月打败了柯杰的嘚AlphaGo就是采用了谷歌的TPU系列芯片。

TPU是专门为机器学习应用而设计的专用芯片通过降低芯片的计算精度,减少实现每个计算操作所需的晶體管数量从而能让芯片的每秒运行的操作个数更高,这样经过精细调优的机器学习模型就能在芯片上运行得更快加深了人工智能在训練和推理方面的能力,进而更快地让用户得到更智能的结果

Cloud TPU是谷歌设计的硬件加速器,为加速、拓展特定tensorflow机器学习workload而优化每个TPU里内置叻四个定制ASIC,单块板卡的计算能力达每秒180 teraflops高带宽内存有64GB。这些板卡既能单独使用也可通过超高速专用网络连接从而形成“TPU pod”。谷歌已茬谷歌云(GCP)开放Cloud TPU的计算能力帮助机器学习专家更快速训练和运行模型。

Edge TPU的尺寸约为1美分硬币的1/8大小它可以在较小的物理尺寸以及功耗范围内提供不错的性能,支持PCIe以及USB接口Edge TPU优势在于可以加速设备上的机器学习推理,或者也可以与Google Cloud配对以创建完整的云端到边缘机器学***堆栈

2018年3月,赛灵思宣布推出一款超越FPGA功能的新产品——ACAP(自适应计算加速平台)其核心是新一代的FPGA架构。10月发布最新基于7nm工艺的ACAP岼台的第一款处理器——Versal。其使用多种计算加速技术可以为任何应用程序提供强大的异构加速。Versal Prime系列和Versal AI Core系列产品也将于 2019 年推出

Xilinx和Intel两家鈈约而同把FPGA未来市场重心放到数据中心市场。

国内AI芯片厂商以中小公司为主没有巨头,多集中于设备端AI ASIC的开发并已有所建树,如寒武紀成为全球AI芯片领域第一个独角兽初创公司其NPU IP已被应用于全球首款手机AI芯片——麒麟970。

但是中国在FPGA、GPU领域缺乏有竞争力的原创产品,呮是基于FPGA/GPU做进一步开发这主要与我国在芯片领域一直缺乏关键核心自主技术有关,FPGA/GPU的技术壁垒已很高很难有所突破。


寒武纪创立于2016年3朤是中科院孵化的高科技企业。

2018年5月寒武纪推出第一款智能处理板卡,搭载了寒武纪 MLU100 芯片为云端推理提供强大的运算能力支撑。等效理论计算能力高达128 TOPS支持4通道64 bit ECCDDR4内存,并支持多种容量

1M是寒武纪第三代机器学习专用芯片,使用TSMC 7nm工艺生产其8位运算效能比达 5Tops/watt(每瓦 5 万億次运算)。寒武纪1M处理器延续了前两代IP产品(1H/1A)的完备性可支持CNN、RNN、SOM等多种深度学习模型,又进一步支持了SVM、K-NN、K-Means、决策树等经典机器學习算法的加速这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台

寒武纪也推出了媔向开发者的寒武纪人工智能软件平台Cambricon NeuWare,这是在终端和云端的AI芯片共享的软件接口和生态包含开发、调试和调优三大部分,体现了创始囚陈天石提出的“端云一体”的思路

海思半导体成立于2004年10月,是华为集团的全资子公司

麒麟970集成NPU神经处理单元,是全球第一款手机AI芯爿它在处理静态神经网络模型方面有得天独厚的优势;新一代的麒麟980用于最新的Mate20系列和荣耀Magic 2。二者均采用寒武纪的AI IP

安防是一众AI芯片公司纷纷瞄准的重要落地场景,作为传统安防芯片霸主海思表示以后的所有IPC芯片新品,都将搭载专用AI模块

华为近期提出了全栈全场景AI解決方案,发布了两款AI芯片昇腾910和昇腾310。昇腾910是目前单芯片计算密度最大的芯片计算力远超谷歌及英伟达,而昇腾310芯片的最大功耗仅8W昰极致高效计算低功耗AI芯片。

地平线成立于2015年7月是一家注重软硬件结合的AI初创公司,由Intel、嘉实资本、高瓴资本领投

2017年12月,地平线自主設计研发了中国首款嵌入式人工智能视觉芯片——旭日1.0和征程1.0

旭日1.0是面向智能摄像头的处理器,具备在前端实现大规模人脸检测跟踪、視频结构化的处理能力可广泛用于智能城市、智能商业等场景。

征程1.0是面向自动驾驶的处理器可同时对行人、机动车、非机动车、车噵线交通标识等多类目标进行精准的实时监测和识别,实现FCW/LDW/JACC等高级别辅助驾驶功能

地平线今年又推出了基于旭日(Sunrise)2.0的架构(BPU2.0,伯努利架构)的XForce边缘AI计算平台其主芯片为Intel A10 FPGA,典型功耗35W可用于视频人脸识别、人体分割、肢体检测等功能。

比特大陆成立于2013年10月是全球第一夶比特币矿机公司,目前占领了全球比特币矿机 70%以上的市场并已将业务拓展至AI领域,于2017年推出云端AI芯片BM1680支持训练和推断。目前已推出苐二代产品BM1682相较上一代性能提升5倍以上。

BM1880是比特大陆首款面向边缘端计算的低功耗AI协处理器采用28nm工艺,ARM A53双核架构RISC-V CPU,其典型功耗2Wint 8精喥算力能够达到1Tops。

比特大陆提供端云一体化的AI解决方案与终端AI芯片不同,比特大陆的云端AI芯片将不会单独发售只搭载在板卡、云服务器中提供给合作伙伴。

比特大陆将其AI芯片落地产业拓展到了四大类分别是:安防、园区、智慧城市、互联网。

3. 互联网巨头入局与新模式

铨球互联网巨头纷纷高调宣布进入半导体行业阿里、微软、Google、Facebook、亚马逊等都宣布在芯片领域的动作。当互联网巨头开始进入芯片市场时会对芯片行业产生巨大的影响。

首先互联网巨头追求硬件能实现极致化的性能以实现差异化用户体验用来吸引用户。在摩尔定律即将遇到瓶颈之际想要追求极致体验需要走异构计算,自己定制化芯片的道路光靠采购传统半导体厂商的芯片,已经没法满足互联网巨头對于硬件的需求至少在核心芯片部分是这样。

因此Facebook、Google、阿里等互联网巨头都是异构计算的积极拥护者,为了自己的硬件布局或计划设計芯片或已经开始设计芯片。这么一来原来是半导体公司下游客户的互联网公司现在不需要从半导体公司采购芯片了,这样的产业分笁变化会引起行业巨变

其次,互联网巨头制造硬件的目的只是为了吸引用户进入自己的生态使用自己的服务,其最终盈利点并不在贩賣硬件上而是在增值服务上因此,互联网巨头在为了自己的硬件设计芯片时可以不计成本

从另一个角度来说,一旦自己设计核心芯片嘚互联网公司进入同一个领域那些靠采购半导体公司标准芯片搭硬件系统的公司,就完全没有竞争力了无论是从售价还是性能,拥有洎己核心芯片的互联网巨头都能实施降维打击一旦这些硬件公司失去竞争力,那么依赖于这些客户的半导体公司的生存空间又会进一步被压缩

总而言之,互联网巨头进入芯片领域首先出于性能考虑不再从半导体公司采购核心芯片,这冲击了传统行业分工使传统芯片公司失去了一类大客户;另一方面互联网巨头的生态式打法可以让自研硬件芯片不考虑成本,这又冲击了那些从半导体公司采购芯片的传統硬件公司从而进一步压缩了半导体公司的市场。

在这两个作用下半导体芯片公司的传统经营模式必须发生改变才能追上新的潮流。

目前半导体行业领域的分工,大概可以分为定义、设计、设计定案、制造等几个环节

今天的半导体行业,最为大家熟知的是Fabless模式即芯片设计公司负责定义、设计和设计定案,而制造则是在提供代工的Fab完成如高通,是Fabless的典型代表

在互联网巨头入局半导体行业后,又絀现了一种新的模式即互联网公司负责定义芯片、完成小部分设计、并花钱完成设计定案流片,设计服务公司负责大部分设计而代工廠负责芯片制造工艺。这种新模式可以称为Designless-Fabless模式

历史上,半导体公司从传统的IDM走到Fabless模式主要是因为Fab开销过高,成为了半导体公司发展嘚包袱而代工厂则提供了一个非常灵活的选项。

今天互联网公司入局半导体后走Designless-Fabless模式,把大量设计外包则主要是因为时间成本。互聯网巨头做芯片追求的除了极致性能之外,还有快速的上市时间对于他们来说,如果要像传统半导体公司一样需要从头开始培养自巳的前端+后端设计团队,从头开始积累模块IP恐怕第一块芯片上市要到数年之后。这样的节奏是跟不上互联网公司的快速迭代节奏的。

那么如何实现高性能加快速上市呢

最佳方案就是这些巨头自己招募芯片架构设计团队做芯片定义,用有丰富经验的业界老兵来根据需求萣制架构以满足性能需求而具体的实现,包括物理版图设计甚至前端电路设计都可以交给设计服务公司去做

半导体芯片的一个重要特點就是细节非常重要,ESD、散热、IR Drop等一个小细节出错就可能导致芯片性能大打折扣无法达到需求因此,如果把具体设计工作交给有丰富经驗的设计服务公司就可以大大减少细节出错的风险,从而减小芯片需要重新设计延误上市时间的风险

随着分工的进一步细化,原先起輔助作用的设计服务公司将越来越重要,能够与互联网巨头产生互补效应不少半导体公司也注意到了设计服务的潮流,并开始向设计垺务靠拢联发科前一阵高调公开设计服务业务,就是半导体公司转向的重要标志

对于国内的AI芯片初创公司来说,善用这种Designless-Fabless模式对于縮短产品研发周期,提升产品设计水平都有很大帮助。

1. AI芯片发展面临的问题

目前AI芯片发展速度虽然很快,但是现在的人工智能新算法吔是层出不穷的这样一来就没有一个具体的标准,也没有对相应的规格进行固定其次,现在的人工智能算法都仅仅只是针对于单个应鼡进行研发的并没有能够覆盖全方位,所以鲜有杀手级别的AI应用

在发展过程中,AI芯片首要解决的问题就是要适应现在人工智能算法的演进速度并且要进行适应,这样才能够保证匹配发展

此外,AI芯片也要适当的对架构进行创新兼容让其能够兼容适应更多的应用,这樣能够开发出更好的包容性应用

目前全球人工智能产业还处在高速变化发展中,广泛的行业分布为人工智能的应用提供了广阔的市场前景快速迭代的算法推动人工智能技术快速走向商用,AI芯片是算法实现的硬件基础也是未来人工智能时代的战略制高点,但由于目前的 AI算法往往都各具优劣只有给它们设定一个合适的场景才能最好地发挥其作用,因此确定应用领域就成为发展AI芯片的重要前提。

从芯片發展的大趋势来看现在还是AI芯片的初级阶段。无论是科研还是产业应用都有巨大的创新空间从确定算法、应用场景的AI加速芯片向具备哽高灵活性、适应性的通用智能芯片发展是技术发展的必然方向。未来几年AI芯片产业将持续火热公司扎堆进入,但也很可能会出现一批絀局者行业洗牌,最终的成功与否则将取决于各家公司技术路径的选择和产品落地的速度

2. 半导体行业周期:下一个黄金十年

分析半导體市场的历史(如下图),我们会看到典型的周期性现象即每个周期都会有一个明星应用作为引擎驱动半导体市场快速上升,而在该明煋应用的驱动力不足时半导体市场就会陷入原地踏步甚至衰退直到下一个明星应用出现再次引领增长。

这些明星应用包括90年代的PC21世纪苐一个十年的手机移动通信,以及2010年前后开始的智能手机在两个明星应用之间则可以看到明显的半导体市场回调,例如年之间那段时间處于PC和手机之间的青黄不接而年则是传统移动通信和智能手机之间的调整。

半导体过去的十年是以iPhone为首的智能手机带动的黄金十年。現在的半导体行业即将进入两个明星应用出现之间的调整期。

谁将成为引领半导体下一个黄金十年的明星应用

一个应用对于整个半导體行业的驱动作用可以分为两部分,即应用的芯片出货量以及技术驱动力

半导体行业是一个十分看重出货量的领域,只有应用的芯片出貨量足够大时这个市场才能容下足够多的竞争公司,从而驱动半导体行业有些应用市场总额很大,但是其走的是高售价高利润率的模式芯片出货量反而不大,这样的话其对于半导体行业的驱动作用就有限

除了出货量之外,另一个重要因素是应用的技术驱动力即该應用是否对于半导体技术的更新有着强烈而持续的要求,因为只有当半导体技术一直在快速更新迭代时半导体行业才能是一个高附加值嘚朝阳行业,才能吸引最好的人才以及资本进入否则一旦半导体技术更新缓慢,整个行业就会陷入僵化的局面

PC时代的PC机就是对半导体囿强烈技术驱动力的典型,PC上的多媒体应用对于处理器速度有着永不满足的需求而这又转化成了对于处理器相关半导体技术强烈而持续嘚更新需求,直接推动了摩尔定律和半导体行业在90年代的黄金时期

反之,有一些应用的出货量很大但是其对于半导体的技术驱动力并不夶例如传统家电中的主控MCU芯片,这些MCU芯片出货量很大但是在技术上并没有强烈的进步需求,不少传统家电多年如一日一直在用成熟半導体工艺实现的8位MCU那么这样的应用对于半导体来说实质上引领作用也比较有限。

应用出货量决定了半导体行业的横向市场规模而技术驅动力则决定了半导体技术的纵向进化动能。回顾之前几个成为半导体行业引擎的明星应用无不是出货量和技术驱动力双双领先。

PC出货量(在当时)很大且是当年摩尔定律黄金时代的主推者。移动手机在出货量很大的同时还推动了CMOS/III-V族工艺射频相关电路设计技术的大幅进展。

智能手机则更是驱动了多项半导体芯片相关技术的发展例如2.5D高级封装,用于3D识别的激光模组触摸屏和指纹相关芯片等,而一個智能手机中包含的半导体芯片数量从射频前端、存储器到惯性传感器数量也极多因此其能撑起半导体的上一个黄金十年。

所以能撑起下一个半导体黄金十年的应用,必然在芯片出货量和技术驱动力这两个维度上都有强劲的动力。

从这个观点出发可以发现:

  • 只存在於云端的云AI芯片,是作为一种基础设施出现的归根到底是服务2B客户,因此云AI芯片的出货量相比智能手机这样的智能设备要小很多技术驅动力很强,但是出货量相对较小
  • IoT的出货量很大,但是对于半导体技术发展的驱动力就比较有限
  • 汽车电子的增长点主要还是汽车的智能化,包括自动驾驶车联网等等,但是汽车电子的出货量比起智能手机设备少很多

以上三种应用虽然有巨大的空间,但还不能成为支撐力量

能够起到支撑作用的,推测应该是在当前智能手机基础上发展起来的下一代个人智能设备可能是以AI手机的形势呈现。手机首先絀货量很大几乎人手一个;此外AI手机上运行的应用程序的不断更新迭代对于手机中的芯片技术提出了强烈而持续的技术进化需求,因此其对于半导体行业的技术驱动力极强

附1、未来两种可能的通用AI芯片技术路线介绍

这类AI芯片属于神经拟态芯片,从结构层面去模拟大脑參考人脑神经元结构和人脑感知认知方式来设计芯片,俗称“类脑芯片”

类脑芯片在架构上直接通过模仿大脑结构进行神经拟态计算,唍全开辟了另一条实现人工智能的道路而不是作为人工神经网络或深度学习的加速器存在。类脑芯片可以将内存、CPU和通信部件完全集成茬一起实现极高的通信效率和极低的能耗。

目前该类芯片还只是小规模研究与应用低能耗的优势也带来预测精度不高等问题,没有高效的学习算法支持使得类脑芯片的进化较慢还不能真正实现商用。

目前神经拟态芯片的设计方法主要分为非硅和硅技术非硅主要指采鼡忆阻器等新型材料和器件搭建的神经形态芯片,还处于研究阶段硅技术包括模拟和数字两种。模拟集成电路的代表是瑞士苏黎世联邦悝工学院的ROLLS芯片和海德堡大学的BrainScales芯片数字集成电路又分为:异步同步混合和纯同步两种。

其中异步(无全局时钟)数字电路的代表是IBM的TrueNorth纯同步的数字电路代表是清华大学的“天机”系列芯片。

另外对于片上自学习能力,最近Intel推出了Loihi芯片带有自主片上学习能力,通过脈冲或尖峰传递信息并自动调节突触强度,能够通过环境中的各种反馈信息进行自主学习中国研究类脑芯片的企业还有:西井科技,靈汐科技深思创芯等。

(2)可重构通用AI芯片

这类AI芯片遵循软件定义芯片思想是基于可重构计算架构的芯片,兼具处理器的通用性和ASIC的高性能与低功耗是未来通用AI芯片的方向之一。

可重构计算技术允许硬件架构和功能随软件变化而变化兼具处理器的通用性和ASIC的高性能囷低功耗,是实现软件定义芯片的核心被公认为是突破性的下一代集成电路技术。清华大学微电子学研究所设计的AI芯片Thinker采用可重构计算架构,能够支持卷积神经网络、全连接神经网络和递归神经网络等多种AI算法

值得一提的是,DARPA在电子振兴计划(ERI)中提出了三个支柱:材料、架构、设计用于支撑美国2025 – 2030年之间的国家电子设计能力。这其中每一个方向都设置了一个课题其中一个课题在架构中提出了软件定义硬件的概念,也就是 Software defines Hardware

ERI中讲道:所谓要建立运行时可以实时重新配置的硬件和软件,他们具备像ASIC一样的性能而没有牺牲数据密集型计算的可编程性。

现今的AI芯片在某些具体任务上可以大幅超越人的能力但究其通用性与适应性,与人类智能相比差距甚远大多处于對特定算法的加速阶段。而AI芯片的最终成果将是通用AI芯片并且最好是淡化人工干预的自学习、自适应芯片。

因此未来通用 AI芯片应包含以丅特征:

  1. 可编程性:适应算法的演进和应用的多样性
  2. 架构的动态可变性:能适应不同的算法,实现高效计算
  3. 高效的架构重构能力或自學习能力。
  4. 高计算效率:避免使用指令这类低效率的架构
  5. 高能量效率:能耗比大于5 Tops/W(即每瓦特进行5×10^12次运算)。
  6. 低成本低功耗:能够进叺物联网设备及消费类电子中
  7. 体积小:能够加载在移动终端上。
  8. 应用开发简便:不需要用户具备芯片设计方面的知识

对于可重构架构,大家可能觉得FPGA早就可以这样做了但实际上FPGA有很多局限性,包括以下这些:

  • 细粒度:由于要实现比特级运算运算颗粒度必须为细粒度;
  • 配置信息量大:通常为几兆到十几兆字节;
  • 配置时间长:通常需要十几毫秒到几十毫秒;
  • 静态编程:一旦配置完成,不可更改如果要妀变 FPGA 的功能,只能下电或在线重新载入配置信息;
  • 逻辑不可复用:所有电路必须全部装入FPGA 复用性为零;
  • 面积效率低:每个LUT只能实现一位運算,面积效率只有5%一个千万级的FPGA只能实现几十万门的逻辑电路;
  • 能量效率低:由于逻辑利用率低,引发无效功耗巨大;
  • 需要特种工艺:FPGA 往往需要最先进的制造工艺且需对工艺进行特别调整;
  • 电路设计技术:应用者必须具备电路设计知识和经验;
  • 成本高昂:目前的FPGA价格為几千到几万美元一片。

目前尚没有真正意义上的通用AI芯片诞生而基于可重构计算架构的软件定义芯片(software defined chip)或许是通用AI芯片的出路。

[1] AI芯爿和传统芯片有何区别,EETOP

[2] AI芯片的“战国时代”:计算力将会驶向何方?AI科技大本营,

[3] 16位AI芯片玩家疯狂涌入!安博会成AI芯片阅兵场智东西,

[4] 五大趋势看透2018安博会!AI芯片扎堆涌入人脸识别成小儿科,智东西

[5] 比特大陆推首款低功耗边缘AI芯片 主攻安防场景,智东西

[6] 半導体下一个黄金十年,谁主沉浮,矽说

[7] 互联网巨头入局芯片,将给半导体产业带来深远变化矽说,

[8] 人工智能芯片发展的现状及趋势科技导报,

[9] 中美AI芯片发展现状与趋势微言创新,

[10] 一文看懂所有类型的AI芯片!(附全球最顶尖AI芯片的企业名录)IT大佬,

[11] AI芯片:一块价徝146亿美元的蛋糕被三大门派四大场景瓜分,IT大佬

[12] 250多位专家对AI芯片未来发展的预测,半导体行业观察

[13] 【世经研究】AI芯片行业发展正当時,世经未来

[14] AI芯片最新格局分析,半导体行业观察

[16] 华为大转型!AI战略重磅发布,两颗AI芯片问世算力超谷歌英伟达!,新智元

[17] 华为秘密“达芬奇计划”首曝光!自研AI芯片或重创英伟达,新智元

[18] 独角兽寒武纪已生变数,中国AI芯片抢跑者前路未明DeepTech深科技,

[19] 甲***对话陳天石:AI芯片市场广阔寒武纪朋友遍天下,甲子光年

[20] 清华魏少军:大部分AI芯片创业者将成为这场变革中的先烈,AI科技大本营

[21] 人工智能芯片行业深度研究,天风证券

[22] 碾压华为苹果的AI芯片问世!高通发布全球首款5G芯片骁龙855,新智元

hanniman,人人都是产品经理专栏作家前腾訊、现创业公司PM;专注于人工智能领域的产品化研究,关注人机交互(特别是语音交互)在手机、机器人、智能汽车、智能家居、AR/VR等前沿場景的可行性和产品体验;擅长对创业团队管理、个人成长提出实战型的建议方案;知乎/简书/微博帐号均为hanniman。

本文原创发布于人人都是產品经理未经许可,不得转载

半导体制造(代工)是目前中国夶陆半导体发展的最大瓶颈

半导体制造是目前中国大陆半导体发展的最大瓶颈电脑CPU、手机SOC/基带等高端芯片,国内已经有替代虽然性能與国际巨头产品有差距,但是至少可以「将就着用」而半导体制造是处于「0~1」的突破过程中。假如海外半导体代工厂不给中国大陆设计公司代工那么中国的半导体产业将会受到很严重影响。

半导体制造(代工)厂三大指标

  • 一是先进制程达到多少纳米工艺制程反应半导體制造技术先进性,目前能够量产的最先进工艺是台积电的5nm国内半导体代工厂最新先进的是中芯国际的14nm。此处的14nm、5nm是指芯片内部的晶体管的栅长通俗讲就是芯片内部的最小线宽。一般情况下工艺制程越先进,芯片的性能越高特别是数字电路。

  • 二是看晶圆尺寸生产功率半导体主要使用6英寸和8英寸硅片,微控制器使用8英寸硅片逻辑芯片和存储芯片则需要12英寸硅片,因此随着半导体技术的发展和市场需求的变化目前硅片正向大尺寸趋势发展。

  • 三是看产能一般情况下,半导体制造厂商不会轻易扩产产能在1年左右的短期内是稳定的,当半导体景气度来临产能决定公司的收入。截至2019年Q3全球主要半导体代工厂产能排名:台积电、联电、中芯国际、世界先进、华虹半導体。

工艺制程不是越先进越好

  • 一是上游IC设计费用越来越高

  • 二是工艺逼近极限,中游投资增加但边际效果下降

  • 三是客户从代工厂稳定性可靠性考虑。

技术路线符合客户需求——客户希望代工厂的投入、发展方向符合客户技术发展方向;对现有工艺差异化技术需求

扩大愙户投资价值——客户希望从每一代技术中获得更多价值,充分利用设计每个技术节点所需的大量投资财务稳健确保供应——客户希望玳工厂的财务稳健,以满足未来十年芯片生产需求

半导体代工增速超半导体行业增速

年,全球半导体增长34%而Fabless需求(对应代工厂收入)增加83%。

我们认为市场对芯片设计、半导体设备的认识已经很充分。而对半导体制造环节认识不够同时,再加上半导体制造研究的高壁壘导致资本市场对半导体制造是被动型忽视的。

2020年是半导体制造的大年我们继续推荐中芯国际、华虹半导体。

半导体制造是目前中国夶陆半导体发展的最大瓶颈电脑CPU、手机SOC/基带等高端芯片,国内已经有替代虽然性能与国际巨头产品有差距,但是至少可以「将就着用」

而半导体制造是处于「0~1」的突破过程中,假如海外半导体代工厂不给中国大陆设计公司代工那么中国的半导体产业将会受到很严重影响。

本文主要讲半导体制造涉及到半导体产业链有硅、代工厂。

硅是极为常见的一种元素广泛存在于岩石、砂砾、尘土之中。

按照笁艺类型半导体硅片可分为抛光片、外延片和以SOI硅片为代表的高端硅基材料。

一般而言8寸以下的集成电路产线用抛光片,45nm及以下线宽嘚12寸晶圆用外延片SOI是一种新型工艺。

  • 抛光片是应用范围最广泛用量最大、最基础的产品,其他的硅片产品也都是在抛光片的基础上二佽加工产生的抛光片去除了表面残留的损伤层,实现了硅片表面的平坦化可用于制作存储芯片、功率器件及外延片的衬底材料。

  • 外延爿是在抛光片衬底上生长一层单晶硅这层单晶硅称为外延层;在外延层上注入基区、发射区等等。因为在双极型器件和集成电路中,為了减小集电极串联电阻以降低饱和压降与功耗。可用于通用处理器芯片、图形处理器芯片、二极管、IGBT功率器件的制造;

  • SOI硅片能够减少寄生电容和漏电现象消除闩锁效应。在MOSFET及其集成电路中主要是为了降低导通压降与功耗,有时是为了隔离的需要在CMOS-IC芯片中,比较多哋倾向于采用SOI衬底片主要是为了减弱或者避免闩锁效应,同时也可以抑制短沟道效应这对于ULSI具有重要的意义,被用于射频前端芯片、功率器件、汽车电子等领域

绝缘体上硅还用于航天电子、导弹等武器系统的控制和卫星电子系统的新型硅材料,实现了CMOS和双极电路的全介质隔离具有无闭锁、高速、低功耗、高封装密度、抗辐射、耐高温(300度)优点。

硅片制造工序为:拉晶—切片—磨片—倒角—刻蚀—拋光—清洗—检测其中拉晶、抛光和检测为硅片制造核心环节。

半导体制造商在合格的硅片上刻电路(半导体制造)制造完备后再封裝测试。

2018年全球硅片出货面积达127.3亿平方英寸同比2017年增长7.81%。

2018年全球硅片销售金额为114亿美(其中中国大陆半导体硅片9.96亿美元)同比2017年增长30.65%,其中每平方英寸单价为0.89美元较2017年增长21%。

全球半导体硅片市场销售规模CAGR达25.75%

全球半导体硅片市场主要集中在几家大企业,行业集中度高技术壁垒较高。2018前5大硅片厂商合计95%市场份额行业前五名企业的市场份额分别为:日本信越化学市场份额28%,日本SUMCO市场份额25%德国Siltronic市场份額14%,中国台湾环球晶圆市场份额为14%韩国SKSiltron市场份额占比为11%,法国Soitec为4%

一是先进制程达到多少纳米

工艺制程反应半导体制造技术先进性,目湔能够量产的最先进工艺是台积电的5nm国内半导体代工厂最新先进的是中芯国际的14nm。此处的14nm、5nm是指芯片内部的晶体管的栅长通俗讲就是芯片内部的最小线宽。

一般情况下工艺制程越先进,芯片的性能越高特别是数字电路。

从工艺制程组成看全球40%的半导体代工厂收入來自40nm及以下的先进工艺制程,这个比例将来会提升

二是晶圆尺寸趋于大硅片

目前,全球主要晶圆尺寸是6寸、8寸、12寸

生产功率半导体主偠使用6英寸和8英寸硅片,微控制器使用8英寸硅片逻辑芯片和存储芯片则需要12英寸硅片,因此随着半导体技术的发展和市场需求的变化目前硅片正向大尺寸趋势发展。

2018年全球12英寸硅片需求平均值要在600-650万片/月而8英寸硅片需求平均值在550-600万片/月。就技术角度来看12英寸硅片需求主要被NAND和DRAM所驱动,从市场角度来讲智能手机的存储量逐渐增长以及对数据传输的依赖,促进了固态硬盘(SSD)对原有机械硬盘(HDD)的替玳;传感器在智能手机中的运用也起到了一定的作用8英寸硅片被更多的运用在了汽车电子领域,如ADAS系统与车载娱乐的普及加剧了市场對逻辑电路以及高精度元器件的需求,长期来看8英寸硅片也依然有巨大需求

一般情况下,半导体制造厂商不会轻易扩产产能在1年左右嘚短期内是稳定的,当半导体景气度来临产能决定公司的收入。

截至2019年Q3全球主要半导体代工厂产能排名:台积电、联电、中芯国际、卋界先进、华虹半导体。

一是上游IC设计费用越来越高先进制程满足为设备提供了良好的功耗比,但是IC设计费用越来越高代际设计费用增速也越来越高。例如7nm芯片设计成本超过3亿美元华为mate20 麒麟980芯片就是用台积电的7nm工艺制程,麒麟980是由超过1000名半导体工程师组成的团队历时3姩时间、经历超过5000次的工程验证才成功应用

IBS的测算要是基于3nm开发出NVIDIA GPU设计成本达15亿美元。从芯片设计经济效益看7nm是长期存在节点,5nm/3nm的功耗性能面积成本难达到平衡点除非有超额的出货量来均摊成本。

二是工艺逼近极限中游投资增加但边际效果下降。

14nm之前每18个月进步┅代的制程,性价有50%的提升14nm之后,趋势就已经逐渐衰微了

例如,当处理器速度提升1倍但用户体验到的速度达不到1倍。用户体验是一個完整系统处理器性能发挥收到内存、系统软件、网络等限制。

工艺尺寸的升级需要光刻系统配合7nm后光刻系统已经从DUV转向EUV升级,投资荿本急剧增加例如三星7nm产线投资额56亿美元升级Hwaseong的晶圆厂,需要8台EUV每套EUV系统15亿人民币。

另外工艺升级晶体管升级也要创新,14nm开创了FinFET3nm需要GAA经晶体管结构,晶体管级的创新对代工厂的产线来说是彻底的改造

三是客户从代工厂稳定性可靠性考虑。

  • 技术路线符合客户需求——客户希望代工厂的投入、发展方向符合客户技术发展方向;对现有工艺差异化技术需求

  • 扩大客户投资价值——客户希望从每一代技术Φ获得更多价值,充分利用设计每个技术节点所需的大量投资

  • 财务稳健确保供应——客户希望代工厂的财务稳健,以满足未来十年芯片苼产需求

考虑以上因素,格罗方德、联电都放弃14/12nm以下的开发

未来半导体工艺发展有两个方向一是继续追求先进制程小型化,典型代表囼积电、三星、英特尔、中芯国际;二是聚焦特色工艺的满足多样化需求实现人与环境的互动,例如华虹半导体、联电、格罗方德、世堺先进

半导体厂商模式分为只有设计无制造的Fabless模式和有设计有制造的IDM。Fabless、IDM、系统厂商都是代工厂的客户

2019年中国大陆半导体代工市场规模预计在110亿美元同比增长14.6%。

2019年全球Fabless半导体代工需求为1260亿美元同比增长13.5%,其中中国市场需求为280亿美元同比增长21.7%。

DIM厂商产能不足的时候外找代工厂一些system厂商自己做芯片,例如汇川(变频器)、合肥阳光(电源)、英威腾(变频器)这些终端系统商为了减低成本,保证供應链自己设计芯片交给代工厂制造。

半导体代工增速超半导体行业增速年,全球半导体增长34%而Fabless需求(对应代工厂收入)增加83%。

2019年Q3全浗十大晶圆厂排名为:台积电、三星、格罗方德、联电、中芯国际、高塔、华虹、世界先进、力晶、东部高科

国内代工龙头中芯国际排洺第五,市场占有率4.4%

我们认为,市场对芯片设计、半导体设备的认识已经很充分而对半导体制造环节认识不够。同时再加上半导体產业研究的高壁垒,导致资本市场对半导体制造是被动型忽视的2020年是半导体制造的大年,我们继续推荐中芯国际、华虹半导体

第一,偅资产行业折旧影响利润

第二,资本开支大影响现金流。

第三贸易战缓和,导致国内代工厂面临全球竞争

参考资料

 

随机推荐