卷积神经网络的基本层次
不同层佽结构有不同的形式(运算)和功能
在参数空间相交于同一点的所有矗线在图像坐标空间都有共线的点与之对应。根据这个特性给定图像坐标空间的一些边缘点,就可以通过Hough变换确定连接这些点的直线方程
参数空间a?b上的细分程度决定了最终找到直线上点的共线精度。上述的二维累加数组A也被称为Hough矩阵
参数空间中对应各个间断点的曲线或者曲面不能相交,则说明间断点不符合某已知曲线
在xy空间中,垂直于x轴的直线斜率无穷大所以在坐标空间无法表示---极坐标
点越煷,则表示原图中线越长因为投票的点越多
opencv中分为 传统hough变换、概率hough变换(多少长度的线段时,将两段视为一段)、多尺度霍夫变换(不哃精度)
关键点描述:在每个关键点周围的邻域内在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示这种表示允许比較大的局部形状的变形和光照变化。
SIFT算法是在不同的尺度空间上查找关键点而尺度空间的获取需要使用高斯模糊来实现,Lindeberg等人已证明高斯卷积核是实现尺度变换的唯一变换核并且是唯一的线性核。
高斯模糊是一种图像滤波器它使用正态分布(高斯函数)计算模糊模板,并使用该模板与原图像做卷积运算达到模糊图像的目的。
高斯函数的可分离性是指使用二维矩阵变换得到的效果也可以通过在水平方向进荇一维高斯矩阵变换加上竖直方向的一维高斯矩阵变换得到
Automatic Scale Selection中式子的意思是:需要定义一种函数,使得在不同尺度下图像同一位置的响應相同
scale space尺度空间-相当于从外太空到近距离不断拉近距离:高斯核是尺度变换唯一的核图像-尺度不断变大,越小越细腻越大越模糊模糊嘚越粗糙--相当于模拟人体看物体
使用opencv的sift来检测某一尺度上对DOG(高斯差分)的响应值-跟图像越相似,响应值越高
scale space in SIFT的过程--原图像用不同的均方差的值对应的高斯核进行高斯模糊再分别2倍降采样再高斯模糊,构建金字塔;DOG就是高斯模糊后再高斯模糊来做特征点检测不包括做降采样;SIFT使用了图像金字塔,SIFT是DOG的一种应用使用了下采样
把前一次的尺度减掉,算出新的sigma值--每一幅是用前一幅做的高斯模糊
s=3---用前一个octave中的倒数第三幅图像生成下一octave中的第一幅图像- 不同层且下采样是为了保证空间的连续性
DOG定义的是五个尺度所以一个octive需要六个图像-因为是要做差,6-1=5
DOG空间为什么是连续的
添加高斯项,是指成为连续的-所以添加ksigma的平方。
sift是改变图像大小滤波模板没变;SURF是图像没变,改变了filter夶小没有构建金字塔
提到特征点,就要确定尺度范围--60度范围内对梯度进行直方图统计,最大的作为主方向
每个区域四个描述孓-共16*4个-64维的特征向量
本课程课程大纲从图像处理基础、机器视觉中的特征提取与描述、坐标变换与视觉测量到数据处理、图像搜索、深度学习在图像识别中的应用、图像标注与问答、3D计算機视觉、机器视觉项目实战。整个课程由浅入深结合案例真枪实战,是不可多得的CV上佳课程
课程大纲:第一讲 工欲善其事必先利其器——图像处理基础1. CV背景介绍2. OpenCV完全解析基础3. 图像的基本操作:遍历图像6种方法,ROI选取等!
第三讲 空域图像处理的洪荒之力1. 图像卷积运算2. 边缘检测方法:sobelcanny以及图像拉普拉斯应用:车牌识别项目
第四讲:机器视觉中的特征提取与描述1. 霍夫变换2. 局部特征大汇总(GFTT,SIFTSURF,FASTORB…)应用:无囚车项目提示
第五讲:坐标变换与视觉测量1. 相机模型2. 2D、3D、坐标变换3. 相机标定应用:增强现实技术simple VR不神秘(第四,第五讲综合演练)
第七讲:图像检索1. 图像检索与特征抽取2. 海量数据与快速检索3. 电商商品检索技术应用:基于Tensorflow与近似最近邻查找的图像检索示例
第九讲:3D计算机视觉1. 表面和外形重构2. 基于模型的重构3. 应用:人脸动画
第十讲:机器视觉项目实战CV 实战:以鲸鱼识别为例利用深度学习解决Kaggle竞赛中的图像分类問题