对于卷积神经网络入门，硕士博士不需要弄明白原理，只需要应用，是这样吗？

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>计算机 >>对于卷积神经网络入门，硕士博士不需要弄明白原理，只需要应用，是这样吗？

对于卷积神经网络入门，硕士博士不需要弄明白原理，只需要应用，是这样吗？

来源：蜘蛛抓取(WebSpider) 时间：2022-11-09 13:31 标签：卷积神经网络入门

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习关于深度学习：可以买本西瓜书，很出名的CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。

首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。

网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习
关于深度学习：可以买本西瓜书，很出名的

CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。

提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。

我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

也可以从发展历史了解一下，先从最基本的MP模型单层感知机开始，但是不能解决XOR问题，多层感知机解决了这个问题。1986年hinton用反向传播算法，有了初代CNN:lenet，用于手写数字识别。然后就是2006年的DBN，2012年的alexnet。
CNN其实不难，就像层主说的，搞清楚卷积层池化层全连接层激活函数的概念和原理，就差不多入门了。要是着急的话可以直接在层主推荐的吴恩达课程里直接看cnn部分的，不着急的话建议从头开始慢慢来打好基础，梯度下降法和反向传播算法要多看看。
最好有数学的基础，梯度和矩阵的知识

先搜知乎科普，再搜b站上手，再深就需要看课程看论文了

下个编译器pycharm，在下个深度学习框架pytorch，再去学习CNN原理，再去博客或者GitHub找一份CNN源码，找个最简单的识别手写数字就行了，然后读懂源码就行了

CNN很好懂得吧。。认真学感觉两周就学会了

兄弟你好像没有搞清楚这几个的关系

不过我好像没注意到anaconda里面也有pycharm……疏忽了疏忽了

补充一下，确切滴说，pycharm叫集成开发环境（IDE），其中包含编辑器的功能。

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习关于深度学习：可以买本西瓜书，很出名的CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。

首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。

网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习
关于深度学习：可以买本西瓜书，很出名的

CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。

提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。

我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习关于深度学习：可以买本西瓜书，很出名的CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

看了一圈评论…都不太靠谱…我跟你说一下吧，我本科毕设做的就是基于卷积神经网络的人脸识别。目前学习方向是深度学习算法。

首先CNN不难，1个月时间只要你每天都认真学，应该可以在理论上打下比较好的基础，最好有时间还要去复现一些CNN的应用。

网课：网易云课堂或者哔哩哔哩搜吴恩达深度学习
关于深度学习：可以买本西瓜书，很出名的

CNN：首先先去了解一下什么是神经网络，神经网络是怎么工作的？都有哪些层？涉及到什么参数？对于DNN比如：输入层（input layer），隐藏层（hidden layer），输出层（output layer）。那CNN比一般的DNN多了些什么呢？最突出的就是卷积层和池化层，一定要了解卷积层怎么工作的？从一维卷积入手到二维的卷积计算，池化层是怎么做到一个对数据进一步降维又能提出特征？知道基本概念之后，要详细知道CNN每一层都有哪些具体的算法以及参数？比如卷积层有一个很重要的东西，我一般叫卷积核，再比如池化层都有哪些池化方法？比如maxpooling。然后了解神经网络的结构，经过了卷积层和池化层之后，最后输出了什么呢？还要经过什么层怎样处理可以得到最终输出的一个特征向量呢？你把这一套流程熟悉了，就算入门了。1个月时间足够，刚开始学很有意思的。

提示：如果你不做算法，只是用的话，或者说入门阶段，那么用python编程直接调包调参即可，不必纠结底层算法。

我就是看到楼主提问，而刚好自己有一些小经验就顺手回答了一下。说得不太详细，如果有不正确的，请批评指正！

小白提，学这个卷积需要懂c语言吗？

刚开始学c语言，看了这个帖子感觉学程序好可怕

卷积神经网络有哪些改进的地方

卷积神经网络的研究的最新进展引发了人们完善立体匹配重建热情。从概念看，基于学习算法能够捕获全局的语义信息，比如基于高光和反射的先验条件，便于得到更加稳健的匹配。

目前已经探求一些两视图立体匹配，用神经网络替换手工设计的相似性度量或正则化方法。这些方法展现出更好的结果，并且逐步超过立体匹配领域的传统方法。

事实上，立体匹配任务完全适合使用CNN，因为图像对是已经过修正过的，因此立体匹配问题转化为水平方向上逐像素的视差估计。

与双目立体匹配不同的是，MVS的输入是任意数目的视图，这是深度学习方法需要解决的一个棘手的问题。

而且只有很少的工作意识到该问题，比如SurfaceNet事先重建彩色体素立方体，将所有像素的颜色信息和相机参数构成一个3D代价体，所构成的3D代价体即为网络的输入。

然而受限于3D代价体巨大的内存消耗，SurfaceNet网络的规模很难增大：SurfaceNet运用了一个启发式的“分而治之”的策略，对于大规模重建场景则需要花费很长的时间。

谷歌人工智能写作项目：爱发猫

什么是卷积神经网络？为什么它们很重要

卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。

20世纪60年代，Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络（ConvolutionalNeuralNetworks-简称CNN）。

现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。

K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后，更多的科研工作者对该网络进行了改进。

其中，具有代表性的研究成果是Alexander和Taylor提出的“改进认知机”，该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。

神经网络的历史是什么？

沃伦·麦卡洛克和沃尔特·皮茨（1943）基于数学和一种称为阈值逻辑的算法创造了一种神经网络的计算模型。这种模型使得神经网络的研究分裂为两种不同研究思路。

一种主要关注大脑中的生物学过程，另一种主要关注神经网络在人工智能里的应用。一、赫布型学习二十世纪40年代后期，心理学家唐纳德·赫布根据神经可塑性的机制创造了一种对学习的假说，现在称作赫布型学习。

赫布型学习被认为是一种典型的非监督式学习规则，它后来的变种是长期增强作用的早期模型。从1948年开始，研究人员将这种计算模型的思想应用到B型图灵机上。

法利和韦斯利·A·克拉克（1954）首次使用计算机，当时称作计算器，在MIT模拟了一个赫布网络。纳撒尼尔·罗切斯特（1956）等人模拟了一台IBM704计算机上的抽象神经网络的行为。

弗兰克·罗森布拉特创造了感知机。这是一种模式识别算法，用简单的加减法实现了两层的计算机学习网络。罗森布拉特也用数学符号描述了基本感知机里没有的回路，例如异或回路。

这种回路一直无法被神经网络处理，直到保罗·韦伯斯(1975)创造了反向传播算法。在马文·明斯基和西摩尔·派普特（1969）发表了一项关于机器学习的研究以后，神经网络的研究停滞不前。

他们发现了神经网络的两个关键问题。第一是基本感知机无法处理异或回路。第二个重要的问题是电脑没有足够的能力来处理大型神经网络所需要的很长的计算时间。

直到计算机具有更强的计算能力之前，神经网络的研究进展缓慢。二、反向传播算法与复兴后来出现的一个关键的进展是保罗·韦伯斯发明的反向传播算法（Werbos1975）。

这个算法有效地解决了异或的问题，还有更普遍的训练多层神经网络的问题。在二十世纪80年代中期，分布式并行处理（当时称作联结主义）流行起来。

戴维·鲁姆哈特和詹姆斯·麦克里兰德的教材对于联结主义在计算机模拟神经活动中的应用提供了全面的论述。神经网络传统上被认为是大脑中的神经活动的简化模型，虽然这个模型和大脑的生理结构之间的关联存在争议。

人们不清楚人工神经网络能多大程度地反映大脑的功能。

支持向量机和其他更简单的方法（例如线性分类器）在机器学习领域的流行度逐渐超过了神经网络，但是在2000年代后期出现的深度学习重新激发了人们对神经网络的兴趣。

三、2006年之后的进展人们用CMOS创造了用于生物物理模拟和神经形态计算的计算设备。最新的研究显示了用于大型主成分分析和卷积神经网络的纳米设备具有良好的前景。

如果成功的话，这会创造出一种新的神经计算设备，因为它依赖于学习而不是编程，并且它从根本上就是模拟的而不是数字化的，虽然它的第一个实例可能是数字化的CMOS设备。

在2009到2012年之间，JürgenSchmidhuber在SwissAILabIDSIA的研究小组研发的循环神经网络和深前馈神经网络赢得了8项关于模式识别和机器学习的国际比赛。

例如，AlexGravesetal.的双向、多维的LSTM赢得了2009年ICDAR的3项关于连笔字识别的比赛，而且之前并不知道关于将要学习的3种语言的信息。

IDSIA的DanCiresan和同事根据这个方法编写的基于GPU的实现赢得了多项模式识别的比赛，包括IJCNN2011交通标志识别比赛等等。

他们的神经网络也是第一个在重要的基准测试中（例如IJCNN2012交通标志识别和NYU的扬·勒丘恩（YannLeCun）的MNIST手写数字问题）能达到或超过人类水平的人工模式识别器。

类似1980年KunihikoFukushima发明的neocognitron和视觉标准结构（由DavidH.Hubel和TorstenWiesel在初级视皮层中发现的那些简单而又复杂的细胞启发）那样有深度的、高度非线性的神经结构可以被多伦多大学杰弗里·辛顿实验室的非监督式学习方法所训练。

2012年，神经网络出现了快速的发展，主要原因在于计算技术的提高，使得很多复杂的运算变得成本低廉。以AlexNet为标志，大量的深度网络开始出现。

2014年出现了残差神经网络，该网络极大解放了神经网络的深度限制，出现了深度学习的概念。

构成典型的人工神经网络具有以下三个部分：1、结构（Architecture）结构指定了网络中的变量和它们的拓扑关系。

例如，神经网络中的变量可以是神经元连接的权重（weights）和神经元的激励值（activitiesoftheneurons）。

2、激励函数（ActivationRule）大部分神经网络模型具有一个短时间尺度的动力学规则，来定义神经元如何根据其他神经元的活动来改变自己的激励值。

一般激励函数依赖于网络中的权重（即该网络的参数）。3、学习规则（LearningRule）学习规则指定了网络中的权重如何随着时间推进而调整。这一般被看做是一种长时间尺度的动力学规则。

一般情况下，学习规则依赖于神经元的激励值。它也可能依赖于监督者提供的目标值和当前权重的值。例如，用于手写识别的一个神经网络，有一组输入神经元。输入神经元会被输入图像的数据所激发。

在激励值被加权并通过一个函数（由网络的设计者确定）后，这些神经元的激励值被传递到其他神经元。这个过程不断重复，直到输出神经元被激发。最后，输出神经元的激励值决定了识别出来的是哪个字母。

类脑和卷积神经网络什么关系

一、“类脑”概念1.在早期，类脑一般是指从软硬件上模拟生物神经系统的结构与信息加工方式。随着软硬件技术的进步，以及神经科学与各种工程技术的多方面融合发展，脑与机的界限被逐步打破。

尤其是脑机接口，在计算机与生物脑之间建立了一条直接交流的信息通道，这为实现脑与机的双向交互、协同工作及一体化奠定了基础。随之，“类脑”的概念逐步从信息域自然地延伸到生命域。

因此，以脑机互联这一独特方式实现计算或智能，也被归入“类脑研究”范畴。

2.类脑研究是以“人造超级大脑”为目标，借鉴人脑的信息处理方式，模拟大脑神经系统，构建以数值计算为基础的虚拟超级脑；或通过脑机交互，将计算与生命体融合，构建以虚拟脑与生物脑为物质基础的脑机一体化的超级大脑，最终建立新型的计算结构与智能形态。

其主要特征包括：A.以信息为主要手段：用信息手段认识脑、模拟脑乃至融合脑；B.以人造超级大脑为核心目标：包括以计算仿脑为主的虚拟超级脑，以及虚拟脑与生物脑一体化的超级大脑这两种形态；C.以学科交叉会聚为突破方式：不单是计算机与神经科学交叉，还需要与微电子、材料、心理、物理、数学等大学科密切交叉会聚，才有更大机会取得突破。

3.类脑研究的主要内容：类脑研究要全面实现“懂脑、仿脑、连脑”，脑认知基础、类脑模拟、脑机互联三个方面缺一不可。

因此，我们将类脑研究主要内容归纳为三个方面：信息手段认识脑、计算方式模拟脑、脑机融合增强脑（见图1）。其中，信息技术贯穿始终。

3.对卷积神经网络的研究始于二十世纪80至90年代，时间延迟网络和LeNet-5是最早出现的卷积神经网络。

在二十一世纪后，随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。

4.卷积神经网络仿造生物的视知觉（visualperception）机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化（grid-liketopology）特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程（featureengineering）要求。

三、二者关系人工智能时代的到来，大数据可以提供给计算机对人脑的模拟训练，强大的算力可以支撑计算机能够充分利用大数据获得更多规律，进行知识的学习。

类脑智能做的面比较广，出发点是开发一个与人脑具有类似功能的模拟大脑出来，达到人类的智慧，深度学习只是其中的一个小小的分支，是对人脑研究的一个小成果，而类脑智能相对研究的比较宽泛和深入。

而卷积神经网络只是深度学习的代表算法之一。

深度学习的职业发展方向有哪些？

当前，人工智能发展借助深度学习技术突破得到了全面关注和助力推动，各国政府高度重视、资本热潮仍在加码，各界对其成为发展热点也达成了共识。

本文旨在分析深度学习技术现状，研判深度学习发展趋势，并针对我国的技术水平提出发展建议。一、深度学习技术现状深度学习是本轮人工智能爆发的关键技术。

人工智能技术在计算机视觉和自然语言处理等领域取得的突破性进展，使得人工智能迎来新一轮爆发式发展。而深度学习是实现这些突破性进展的关键技术。

其中，基于深度卷积网络的图像分类技术已超过人眼的准确率，基于深度神经网络的语音识别技术已达到95%的准确率，基于深度神经网络的机器翻译技术已接近人类的平均翻译水平。

准确率的大幅提升使得计算机视觉和自然语言处理进入产业化阶段，带来新产业的兴起。深度学习是大数据时代的算法利器，成为近几年的研究热点。和传统的机器学习算法相比，深度学习技术有着两方面的优势。

一是深度学习技术可随着数据规模的增加不断提升其性能，而传统机器学习算法难以利用海量数据持续提升其性能。

二是深度学习技术可以从数据中直接提取特征，削减了对每一个问题设计特征提取器的工作，而传统机器学习算法需要人工提取特征。

因此，深度学习成为大数据时代的热点技术，学术界和产业界都对深度学习展开了大量的研究和实践工作。深度学习各类模型全面赋能基础应用。卷积神经网络和循环神经网络是两类获得广泛应用的深度神经网络模型。

计算机视觉和自然语言处理是人工智能两大基础应用。卷积神经网络广泛应用于计算机视觉领域，在图像分类、目标检测、语义分割等任务上的表现大大超越传统方法。

循环神经网络适合解决序列信息相关问题，已广泛应用于自然语言处理领域，如语音识别、机器翻译、对话系统等。深度学习技术仍不完美，有待于进一步提升。

一是深度神经网络的模型复杂度高，巨量的参数导致模型尺寸大，难以部署到移动终端设备。二是模型训练所需的数据量大，而训练数据样本获取、标注成本高，有些场景样本难以获取。

三是应用门槛高，算法建模及调参过程复杂繁琐、算法设计周期长、系统实施维护困难。四是缺乏因果推理能力，图灵奖得主、贝叶斯网络之父JudeaPearl指出当前的深度学习不过只是“曲线拟合”。

五是存在可解释性问题，由于内部的参数共享和复杂的特征抽取与组合，很难解释模型到底学习到了什么，但出于安全性考虑以及伦理和法律的需要，算法的可解释性又是十分必要的。因此，深度学习仍需解决以上问题。

二、深度学习发展趋势深度神经网络呈现层数越来越深，结构越来越复杂的发展趋势。为了不断提升深度神经网络的性能，业界从网络深度和网络结构两方面持续进行探索。

神经网络的层数已扩展到上百层甚至上千层，随着网络层数的不断加深，其学习效果也越来越好，2015年微软提出的ResNet以152层的网络深度在图像分类任务上准确率首次超过人眼。

新的网络设计结构不断被提出，使得神经网络的结构越来越复杂。

如：2014年谷歌提出了Inception网络结构、2015年微软提出了残差网络结构、2016年黄高等人提出了密集连接网络结构，这些网络结构设计不断提升了深度神经网络的性能。

深度神经网络节点功能不断丰富。为了克服目前神经网络存在的局限性，业界探索并提出了新型神经网络节点，使得神经网络的功能越来越丰富。

2017年，杰弗里辛顿提出了胶囊网络的概念，采用胶囊作为网络节点，理论上更接近人脑的行为，旨在克服卷积神经网络没有空间分层和推理能力等局限性。

2018年，DeepMind、谷歌大脑、MIT的学者联合提出了图网络的概念，定义了一类新的模块，具有关系归纳偏置功能，旨在赋予深度学习因果推理的能力。深度神经网络工程化应用技术不断深化。

深度神经网络模型大都具有上亿的参数量和数百兆的占用空间，运算量大，难以部署到智能手机、摄像头和可穿戴设备等性能和资源受限的终端类设备。

为了解决这个问题，业界采用模型压缩技术降低模型参数量和尺寸，减少运算量。目前采用的模型压缩方法包括对已训练好的模型做修剪（如剪枝、权值共享和量化等）和设计更精细的模型（如MobileNet等）两类。

深度学习算法建模及调参过程繁琐，应用门槛高。为了降低深度学习的应用门槛，业界提出了自动化机器学习（AutoML）技术，可实现深度神经网络的自动化设计，简化使用流程。

深度学习与多种机器学习技术不断融合发展。

深度学习与强化学习融合发展诞生的深度强化学习技术，结合了深度学习的感知能力和强化学习的决策能力，克服了强化学习只适用于状态为离散且低维的缺陷，可直接从高维原始数据学习控制策略。

为了降低深度神经网络模型训练所需的数据量，业界引入了迁移学习的思想，从而诞生了深度迁移学习技术。迁移学习是指利用数据、任务或模型之间的相似性，将在旧领域学习过的模型，应用于新领域的一种学习过程。

通过将训练好的模型迁移到类似场景，实现只需少量的训练数据就可以达到较好的效果。三、未来发展建议加强图网络、深度强化学习以及生成式对抗网络等前沿技术研究。

由于我国在深度学习领域缺乏重大原创性研究成果，基础理论研究贡献不足，如胶囊网络、图网络等创新性、原创性概念是由美国专家提出，我国研究贡献不足。

在深度强化学习方面，目前最新的研究成果大都是由DeepMind和OpenAI等国外公司的研究人员提出，我国尚没有突破性研究成果。

近几年的研究热点生成式对抗网络（GAN）是由美国的研究人员Goodfellow提出，并且谷歌、facebook、twitter和苹果等公司纷纷提出了各种改进和应用模型，有力推动了GAN技术的发展，而我国在这方面取得的研究成果较少。

因此，应鼓励科研院所及企业加强深度神经网络与因果推理模型结合、生成式对抗网络以及深度强化学习等前沿技术的研究，提出更多原创性研究成果，增强全球学术研究影响力。

加快自动化机器学习、模型压缩等深度学习应用技术研究。依托国内的市场优势和企业的成长优势，针对具有我国特色的个性化应用需求，加快对深度学习应用技术的研究。

加强对自动化机器学习、模型压缩等技术的研究，加快深度学习的工程化落地应用。加强深度学习在计算机视觉领域应用研究，进一步提升目标识别等视觉任务的准确率，以及在实际应用场景中的性能。

加强深度学习在自然语言处理领域的应用研究，提出性能更优的算法模型，提升机器翻译、对话系统等应用的性能。

来源：产业智能官END更多精彩内容请登录官方网站往期精选▼1.饮鹿网年中国人工智能产业创新百强榜单发布！2.饮鹿网年中国人工智能产业Top20投资机构榜单发布！

3.饮鹿网年中国大数据产业创新百强榜单发布！4.饮鹿网年中国大数据产业Top20投资机构榜单发布！

5.饮鹿网年中国物联网产业创新百强榜单发布！6.饮鹿网年中国5G与物联网产业TOP20投资机构榜单发布！

7.饮鹿网年中国集成电路产业创新百强榜单发布！8.饮鹿网年中国集成电路产业Top20投资机构榜单发布！

9.饮鹿网年中国企业服务产业创新百强榜单发布！10.饮鹿网年中国企业服务产业TOP20投资机构榜单发布！

深度学习中的卷积网络到底怎么回事

这两个概念实际上是互相交叉的，例如，卷积神经网络（Convolutionalneuralnetworks，简称CNNs）就是一种深度的监督学习下的机器学习模型，而深度置信网（DeepBeliefNets，简称DBNs）就是一种无监督学习下的机器学习模型。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。

此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。

CNN（卷积神经网络）是什么？

在数字图像处理的时候我们用卷积来滤波是因为我们用的卷积模版在频域上确实是高通低通带通等等物理意义上的滤波器。

然而在神经网络中，模版的参数是训练出来的，我认为是纯数学意义的东西，很难理解为在频域上还有什么意义，所以我不认为神经网络里的卷积有滤波的作用。接着谈一下个人的理解。

首先不管是不是卷积神经网络，只要是神经网络，本质上就是在用一层层简单的函数（不管是sigmoid还是Relu）来拟合一个极其复杂的函数，而拟合的过程就是通过一次次backpropagation来调参从而使代价函数最小。