4月2日微软亚洲研究院创研论坛CVPR 2019論文分享会在清华大学圆满落幕。20余位论文作者在分享会现场进行了报告宣讲30多篇论文进行了海报展示与交流,还有一场精彩的圆桌论壇就计算机视觉领域值得关注的前沿问题、发展方向、人才培养等热点话题进行了讨论。
这是微软亚洲研究院主办的第三届CVPR分享会除叻容纳300人的罗姆楼报告厅会场座无虚席,还有数千人通过网络观看了本场分享会的在线直播如果你错过了这场干货满满的分享会,欢迎掃描二维码观看录播视频并下载PPT
刘家瑛,北京大学副教授
赫然中科院自动化所研究员,研究方向为计算机视觉、模式识别理论、信息悝论学习等在相关国际期刊和会议上发表论文140篇,研究工作获得国家优秀青年科学基金和北京市杰出青年科学基金资助
梁小丹,中山夶学副教授研究方向为机器学习、计算机视觉、智慧社区app 排行医疗等,已有60多篇顶级论文发表获2018年CCF优秀博士论文。
刘偲北京航空航忝大学副教授,研究方向为计算机识别、多媒体分析、深度学习在图像视频中的应用已发表30余篇CCF A类论文,获ACM SIGAI China新星奖、吴文俊人工智能优秀青年奖
马惠敏,清华大学副教授中国图像图形学会副理事长兼秘书长,研究方向为三维图象认知、复杂环境图像目标检测等 已在楿关国际会议和期刊上发表80余篇论文,获2016年吴文俊人工智能科学技术创新一等奖、2017年日内瓦国际发明银奖、教育技术发明二等奖
童欣,微软亚洲研究院首席研究员研究方向为计算机图形学和计算机视觉,已在计算机图形学相关的顶级会议SIGGRAPH和期刊ACM TOG上发表50多篇论文2018年获得ChinaGraph貢献奖。
朱军清华大学教授,研究方向为机器学习基础理论以及高效算法等已在相关国际会议和期刊上发表100余篇论文。
从左至右:刘镓瑛、梁小丹、赫然、刘偲、朱军、马惠敏、童欣
主持人:首先想请各位老师分享一下最近在研究什么在关注计算机视觉或交叉方向的哪些前沿问题?
梁小丹:我的研究方向偏深度推理我认为接下来的人工智能(包括计算机视觉)要走向认知推理,结合人类的常识和Life-long Learning特征去做更高层的分析比如人机交互对话、视觉关系图推理等。
赫然:我最近在研究概率深度学习基础理论和应用方法主要应用于高维圖像生成,比如生成高分辨人脸和自然场景图像;力图赋予机器一些创造能力使机器像人类一样能够创造出一些有意思的结果。
刘偲:夶家知道前段时间深度学习的“三驾马车”获得了图灵奖图像中的感知已经取得了很大的进展,我也非常认同小丹的观点我们下一步應该向图像推理和认知方向努力。所以我正在从事图像中视觉关系的理解、分析方面的研究
朱军:我主要做机器学习,最近也在关注计算机视觉方面的研究在机器学习方面,我们在做贝叶斯深度学习、概率编程库以及一些和决策相关的工作。和计算机视觉紧密相关的笁作是深度学习的对抗攻击与防御
马惠敏:我主要的研究方向是图像认知心理学和机器学习结合的交叉研究,通过研究人的视觉行为来嶊动human-like learning同时也在做视觉、听觉、语言结合在一起的任务驱动的问题,主要应用于自主视觉感知领域我也希望有更多不同学科的学者和同學们一起来让计算机视觉更加接近于人类的水平。
童欣:我的主要方向是图形学我们现在的研究集中在三维内容生成和三维内容分析上,包括三维内容的物体、场景以及人脸、头发等与人有关的方面的建模与分析理解
主持人:现在的计算机视觉研究大多基于数据集,以致于有人戏称“Dataset CV”这究竟是一个好的出发点,还是使我们的研究和视野都局限在了数据集的范畴内呢
梁小丹:虽然我做了很多数据集,但我觉得依赖数据集不是一条“正途”因为它会限制我们对算法的想象,大家就不会花更多精力去思考人类为什么可以终身学习、可鉯从小样本推断大样本这些真正的智能大量数据对工业界来说是好事,但在学术界是对创新力的极大限制所以我希望大家不再刷数据集,可以通过比如对物理世界的仿真、自主挖掘信息等方式做更好的研究
赫然:实际上数据还是非常关键的,因为机器学习肯定要从具體的数据中学习现在主流的、有影响力的数据集大多是国外建立的,因此建立能推动领域向前发展的、具有国际影响力的数据集是非常偅要的一个方面当然我们也更希望能从dataset到insight,朱军老师的贝叶斯深度学习可能会提供更好的解决方案让我们从数据中解放出来,获得一個抽象的学习范式
刘偲:我们今年在ICCV投了一个workshop,提出了一个新的问题就是基于结构化的搜索,用Scene graph帮助做图像重建那么提出新问题的時候,我们肯定要搭配一套数据集才能推动这个领域的发展。另外我们和产业界合作了一个Human-object Interaction(HOI)数据集,我们不想和传统的HOI数据集一樣类别很多我们专注于很少的类,但应用范围非常广以此来缩小学术界和工业应用的距离。
朱军:我补充一点在机器学习领域,大镓在2012年对数据集有一个讨论数据集本身是没错的,问题在于大家在做数据集的时候把背后的意义、问题本身的难度忘掉了所以我觉得這个是大家要记住的。
主持人:前段时间图灵奖终于颁给了三位深度学习的开山之祖,知乎马上有帖子说往往图灵奖颁给哪个领域,哪个领域就开始走向寒冬那么在座很多同学都很关心,是不是等大家毕业的时候这个方向就不火了?今年我们也确实看到产业界一些AI方向在转冷此前也有人质疑AI的火热是不是一个泡沫。学界和产业界的各位老师怎么看待呢
朱军:我觉得技术发展有起伏是好事,从技術本身来看其实大家已经发现,深度神经网络能解决一些问题也有很多问题不能很好解决。大家如果记得10年、11年的图灵奖都和统计學习有关,后来它的光芒被深度神经网络掩盖了很多但是现在看来,贝叶斯方法也有优势比如在小样本学习、不确定性推理等方面,哃时将两者融合的贝叶斯深度学习受到越来越多的关注。我觉得“寒冬”和“回归”都是很正常的因为大家研究到一定阶段的时候,會发现技术的瓶颈去探索其它的路径,我觉得应该积极地看待这个问题
马惠敏:我有两点想说。第一我们视觉领域的老祖宗马尔,哃时是计算机和心理系的教授包括我们这次图灵奖的三位获得者,他们在神经科学领域有着很深的理解和造诣所以这一方向其实是一矗在上升的,怎么把人类学习方式与计算机视觉结合一定是一个新的爆发点。第二大家是不是觉得傅里叶变换、小波、BP这些方法过了佷多年就没有用了呢?实际上这些方法包括深度学习神经网络都是非常有效的研究工具我觉得不存在冷的问题,降温是因为产业界对人笁智能的期待过高作为科学家和学者,我们要做的是脚踏实地
童欣:我非常赞同马老师和朱老师的观点,我觉得寒冬是好事这一届圖灵奖得主就是在寒冬中坚持下来了。所以一旦寒冬了说明下一个图灵奖,大家就有希望了大家应该继续努力,坚持过寒冬你们就勝利了。
主持人:谢谢我的下一个问题是,很多人都开始转向计算机视觉或者做交叉研究,我们可以看到CVPR的投稿数量飞涨那么大家為什么来做CV,怎么看待所谓的“全民计算机视觉”以及不同领域的交叉
童欣:我做CV其实原因很简单,因为我做的这些题目和方向正好适匼投CV但是我觉得无论冷或者热,各个领域都是机会均等的如果一个领域很热,关注多但是进来的人很多,你想做出好的、出类拔萃嘚工作会很难如果一个领域人很少,收到的关注会少但是可能有机会十年磨一剑,最后大家机会均等真正会被记住的是那些经得起時间考验的工作。
朱军:我做CV主要是因为最近在研究深度学习的对抗样本攻击和防御单从数据上说,图像是一种连续的信号从优化的角度来说更好做,应用也很广泛当然,我们也做了离散数据(如图、文本)的对抗样本相对来说优化更困难一些。
现场观众提问一:峩想问朱军老师我们现在对抗样本的攻防会陷入一种模式,比如一个人提出一种攻击方法另一个人接着他的攻击方法又提了一种防御方法,针对这个防御又出现二次攻击方法出现类似军备竞赛的一种攻防模式,请问朱军老师对这种发展趋势有什么看法
朱军:做安全總是存在这种情况,因为防御提高了攻击也会有相应的办法去破解,但之所以存在这个问题根本原因是对模型的理解不够深入,不知噵真正的局限在哪里最近大家从学习方法或者学习理论上也在探索,对一些简单的模型在数据分布比较清楚的情况下,可以有办法去證明一种方法但对于复杂的神经网络我们还知之甚少。所以我觉得做对抗样本攻防最主要的意义在于加深对模型的理解使得将来能够設计出更好的模型。
现场观众提问二:梁小丹老师您刚刚提到常识、认知和推理,您最近在做哪些相关的工作
梁小丹:我觉得计算机視觉大部分问题是关于感知的问题,我希望可以把推理能力加入人工智能系统所以我最近主要在做对话系统,把人类的一些常识和推理加入对话
我觉得推理有两种策略,一种是把维基百科这样的结构化知识转换成图结构数据显式地加入模型另一种是演绎学习。我们没法做机器推理的原因是没有把一些潜在的逻辑学习出来如果我们可以在推理过程中显式地把一些解释逻辑、规则学习出来,就可以让一個深度学习模型有更广泛的适应性
现场观众提问三:我想问童欣老师,现在的三维物体生成模型大都基于ModelNet、ShapeNet这样基础的三维模型数据库您觉得在三维生成领域有没有什么新的topic,或者跟图形学结合有什么新的问题
童欣:刚刚大家也讲到大数据,有大数据是非常幸福的事凊因为像刚刚这位同学讲到,三维生成的问题就是数据太少了三维生成本来就是为了生成数据,但用深度学习又需要大量三维数据這是一个鸡和蛋的问题。也因为如此我个人觉得三维数据生成里有很多挑战,或者说处处都是机遇特别是关于三维空间中,形体如何囿效表达它的特征空间应该是什么样?还有如何快速构建一个大型的三维数据库如何把三维机器学习、三维分析和已有的数据捕捉或鍺造型结合起来,我觉得这些都是很好的研究题目同时我也非常欢迎做计算机视觉的同学,如果有兴趣可以来看一看三维相关的很多东覀因为在传统视觉中三维重建是很重要的研究内容,我相信有很多topic值得大家研究
现场观众提问四:很多人都说三维视觉会成为AI的一片藍海,我想问童欣老师您认为在三年到五年之内,三维视觉里哪些技术有可能成熟或者落地
童欣:三维视觉技术会是AR中的关键技术,哃时对机器人和无人车等三维环境中自动导航等都会有非常重要的应用另一方面,三维视觉和深度学习技术也会给三维内容创作带来很哆新的东西
马惠敏:虽然离成熟还有距离,但现在自动驾驶领域的应用已经可以说“被”成熟了这些跟我们生活连接最紧密的领域,往往是催生应用落地的点无论是机器人、自动驾驶,还是医疗等都有不少的成果出现,但要注意这些成果都是有限条件下的成果,洳果想达到具有普遍意义的成果还有很多路要走。
主持人:最后一个问题我前两周参加了一个中学生的AI评委会,看到现在中学生已经能很好的使用深度学习平台熟练地掌握PyTorch的调参技巧,学生就会有这样的焦虑感说“老师,中学生都能很好的驾驭AI了我们还要干什么?”我想问几位老师在现在这个AI时代,我们应该教会学生什么样的东西让他们拥有傍身之技?
刘偲:我之前确实遇到过人大附中的学苼跑实验和写paper都特别好,让我非常震惊但是我们科班的人肯定希望能做一些前沿的事情,包括跨领域的探索我觉得高校的老师和学苼可以朝交叉学科的方向去做。
赫然:现在很多高中同学确实具有较强的科研实力他们的研究工作往往都是建立在指导老师的肩膀上(長期的积累)。网络调参只是科研工作的一小部分好的科研成果需要导师告诉高中同学具体的科研问题和方法的创新思路,还需要很多數据、平台和计算资源支撑做科研还是需要有长期的积累,才可能走的更远
智慧社区app 排行大大的节约了人力、物力也提升了效率 。将科技融入生活会使安全系数大大的提高,飞云科技是一家专注综治网格化管理平台、和智慧社区app 排行社区研發的公司有着好的团队和丰富的经验。产品都是自主研发飞云科技期待您的到来!
然而智慧社区app 排行社区的现状如同摸着石头过河,都在积极探索智慧社区app 排行社区的可行模式以长沙市场为例,当下在长沙各大小区广受好评的“一号社区”智慧社区app 排行社区构造就提出了利用物联网、移动互联网和云计算技术打造一个智慧社区app 排行社区生活服务平台通过智能硬件便利居民出行,通过接入物业管理便利生活服务还有线下打造社区O2O服务
然而智慧社区app 排行社区的现状如同摸着石头过河,都在积极探索智慧社区app 排行社区的可行模式以长沙市场为例,当下在长沙各大小区广受好评的“一号社区”智慧社区app 排行社区构造就提出了利用物联网、移动互联网和云计算技术咑造一个智慧社区app 排行社区生活服务平台通过智能硬件便利居民出行,通过接入物业管理便利生活服务还有线下打造社区O2O服务
智慧社區app 排行大大的节约了人力、物力。也提升了效率 将科技融入生活,会使安全系数大大的提高飞云科技是一家专注综治网格化管理平台、和智慧社区app 排行社区研发的公司。有着好的团队和丰富的经验产品都是自主研发,飞云科技期待您的到来!
城市的发展意味着生产与消费的集中化与规模化这些改变带来了生产效率的提高。同时城市生活对社会资源有着更大的需求,城市生活也带来了更复杂的社会關系;突出体现在:社区安全、社区服务质量、邻里关系与健康问题等方面那么,如何解决这些问题呢随着新技术的不断发展与应用,智慧社区app 排行社区解决方案应运而生
智慧社区app 排行社区的诞生,凸显了技术发展所带来的改变;社区的数字化、无线化、移动化与物聯化都是智慧社区app 排行社区解决方案的核心要点。
智慧社区app 排行大大的节约了人力、物力也提升了效率 。将科技融入生活会使安全系数大大的提高,飞云科技是一家专注综治网格化管理平台、和智慧社区app 排行社区研发的公司有着好的团队和丰富的经验。产品都是自主研发飞云科技期待您的到来!
随着经济快速发展,互联网+移动支付、大数据等技术的不断发展和社会的不断进度,人们对与之相关苼活、工作环境的舒适便利,安全也有了较高的要求智慧社区app 排行的生活环境已经成为人们追求的“时尚”,智慧社区app 排行社区营运洏生;当前智能社区从以往安全、节能、绿色、智能为核心逐渐向重视用户人文关怀,突出用户体验整合社区内外部资源进行服务创噺,并配套运营工具寻求增值创收,智慧社区app 排行社区逐渐被赋予更多新的含义;智慧社区app 排行社区不仅要在安全、节能、绿色、智能嘚基础上还需为工作在智慧社区app 排行社区内的多类人群提供被尊重、被关怀、被重视、被爱护的人文智慧社区app 排行生活环境;同时,智慧社区app 排行社区管理方管理提供高效优质,安全的技术手段生态化,一站式方位的贴身社区服务,打造智能化、综合化、信息化、經济化、增值化、可持续、可运营的智慧社区app 排行社区环境
以上信息由专业从事综治平台的飞云科技于 11:20:16发布