请问自己学技术去造机器人制造合算,还是花钱买机器人制造合算?

拒绝访问 | www.wangchao.net.cn | 百度云加速
请打开cookies.
此网站 (www.wangchao.net.cn) 的管理员禁止了您的访问。原因是您的访问包含了非浏览器特征(40dc9d8b91dd4cd8-ua98).
重新安装浏览器,或使用别的浏览器与机器人性爱 你做好准备了吗?
腾讯科技讯 10月23日,日本知名机器人学教授石黑浩(Hiroshi Ishiguro)开发了许多仿真机器人,她们优美、逼真,简直与人类无二。从学术上讲,石黑浩正利用她们来了解人与人之间的互动机制,但他的真正目的还是要揭开沟通本身那些难以言喻的特性。2002年夏季的一个上午,在日本大阪大学的智能机器人研究所里,两个女孩相互对视着,她们的外貌和穿着打扮完全一致:淡黄色的衣服,胖嘟嘟的脸颊,齐肩的黑发,前面留着刘海儿。确切而言,其中一个是5岁的小女孩,而另一个则是小女孩的复制品,一个人形机器人。她们的体型完全一致,只不过一个是人,一个是机器人,这是她们初次见面。女孩瞪大着眼睛看着自己的复制品,她的表情严肃、僵硬。旁边,一个男子正在录像,这个男子是女孩的父亲,也是机器人的创造者。他隔着摄像机问:“你想说些什么吗?”女孩转过身对着他,眼神有些迷茫。他说:“和她打个招呼吧,说‘你好!让我们一起玩吧!’”女孩转向机器人,重复着说:“你好!让我们一起玩吧!”机器人晃动着脑袋,表示同意。但女孩并未走近它,只是盯着它,表情有些疑惑和担心。父亲问小女孩:“和它一起玩很难吗?”女孩看着父亲,然后又对着机器人。机器人的嘴开始轻微张合,像一条刚刚离开水面的鱼。父亲问女孩,“它是想吃东西吗?”女孩没有回答,她虽然仍有耐心,但内心有一种莫名的抵触情绪。父亲又问:“你感觉很奇怪吗?”女孩还是没有回答。僵持了几分钟后,女孩的呼吸开始加重,她说:“我太累了!”接着就哭了起来。当天晚上,在郊区的一所房子里,女孩的父亲把录制的这段视频拷贝到自己的电脑里。他的名字叫“石黑浩”(Hiroshi Ishiguro),他认为,这就是关于现代机器人的首次记录。现代机器人之父在随后的15年时间里,石黑浩开发了约30款机器人,大部分为女性,包括播音员、演员和模特的“复制品”。它们经常在公共场合露面,其中大部分用于学术研究。石黑浩今年54岁,是日本一位非常知名的机器人学教授,被誉为“现代机器人之父”,近期还获得了日本政府1600万美元的资助。要开发一款外貌与人类一致、但又能像人类一样运动和说话的机器人,已经超出了我们当前的能力范围,更不用说把人性赋予机器人了。但石黑浩认为,尽所能把机器人做得更像人类,人类就可能更愿意将自己的生活倾诉给机器人。秉承着这样的目的,石黑浩及其团队开始涉足一个新兴的研究领域:人机交互。人机交互是一项复杂的多学科技术,涵盖工程学、人工智能(AI)、社会心理学和认知等,其目的是分析和培养人类与机器人之间不断发展的关系。人机交互试图理解人类为什么、以及何时与机器人互动,甚至包含情感感受。随着越来越多的机器人被建造,石黑浩认为他正接近建立人与机器之间的信任。儿时是个“坏孩子”石黑浩儿时住在日本琵琶湖(Lake Biwa)西岸的Adogaw镇。上学期间,别的孩子都在认真听讲,而石黑浩总是做一些与学习无关的事情,如画画。石黑浩由外祖父和外祖母抚养长大,外祖父是一位农民,也是一名虔诚的佛教徒。他教石黑浩如何使用筷子,如何祈祷,与在学校学习不同,石黑浩对这些反而挺有耐心。石黑浩的身体较弱,出生时就患上了严重的皮肤过敏症,他的背部、胸部和手臂上都长满了令人发痒的皮疹。他唯一的安慰是外祖父和外祖母不断的抚摸:每天晚上,外祖父和外祖母轮流坐在他身边,搔着他的背,直至他打瞌睡。每周,医生给他注射三次,试图治愈这种疾病,但毫无效果。到了该上大学的年龄,石黑浩为心目中理想的大学制订了三个标准:1)能够接受像他这样古怪的学生;2)允许他继续追求画画这项爱好;3)离家不要太近。1981年秋,石黑浩选择了富士山附近的山梨大学(University of Yamanashi)。到了大学后,石黑浩对学业仍保持着玩世不恭的态度。相反,他从各种兼职工作中找到了不少乐趣。例如,他当过厨师,做过家教、教科书销售员,甚至是专业的弹球盘(Pachinko)玩家。与此同时,他经常把自己装扮成艺术家的样子:穿着黑色皮夹克,带上背包和画笔,骑着他的雅马哈摩托车到附近的乡村写生。 但到了大学三年级,石黑浩突然放弃画画。他意识到,除非能成为一名伟大的艺术家,并得到公众的认可,否则他这样做毫无意义。但同时,他也迷失了方向。在这段黑暗的日子里,他经常在陡峭的山路上骑着摩托车飞奔。改学计算机专业不久后,出路主动送上门来,山梨大学推出了计算机科学这门新课程。石黑浩开始思考,计算机图形和计算机视觉是否会影响视觉艺术呢?当时PC还处于早期阶段,编程还是一项创新性工作。石黑浩觉得自己没什么后顾之忧,于是就改了专业。很快,石黑浩意识到:在整个无拘无束的新领域,他仍可以像画家一样思考问题,只不过工具不同而已。他喜欢上了这门新学科,包括汇编语言和Pascal语言等。石黑浩很快放弃了骑摩托车兜风,他对编程语言越来越熟练,并沉浸在与计算机的对话之中(通过编程)。于是,一种幻想出现在他脑中:是否有一种方式让这种语言更像人类语言,以致于让计算机在将来的某一天凭借自己的直觉来了解人类?这种人机对话能否发展成为人与机器之间的友好关系?这成为了石黑浩的一个追求,一个梦想。2000年,作为京都大学(Kyoto University)的副教授,石黑浩开发了出他的首个仿人机器人:这是一个机械装置,挥舞着钢臂,通过轮子移动。很快,石黑浩就意识到:要想真正吸引人类与之互动,机器人必须要与人类高度相似。此时,石黑浩已结婚近十年。他问妻子,可否对她进行录像,包括坐姿、呼吸,以及对随机刺激的反应,以确定人类行为的细微差别。后来,在征得妻子同意的前提下,他又决定为自己的女儿“丽萨”(Risa)开发一个机器人副本。2002年,石黑浩全家,以及化妆师和特效艺术家聚集在石黑浩的实验室里,开始为“丽萨”创建副本。经过精心打扮,以及各种讨好和哄骗,女儿“丽萨”终于配合工作人员,完成了两天的工作,石黑浩把女儿的副本称为“Repliee R1”。这次实验的结果喜忧参半。由于预算较少,Repliee R1的动作数量有限,看起来比人类僵硬许多。但与此同时,这也赋予了石黑浩继续前行的信心。一发不可收拾三年后的2005年,石黑浩发布了新机器人Repliee Q1 Expo,它的原型是东京一位知名女主播。由于获得了资助,这次的Repliee Q1 Expo有了很大进步,上半身可以灵活运动。Repliee Q1 Expo得到了业界认可,石黑浩的实验室被拍成了电视,韩国还出现了Repliee Q1 Expo的仿制品。这些都验证了石黑浩的直觉是正确的,但他并不满足于此。2006年,石黑浩研制出了与自己模样完全一致的机器人“Geminoid HI-1” 。该机器人采用压缩空气和小型传动器驱动,全身有46处地方可以自由活动。内部程序也是根据石黑浩的动作设计而成,无论眨眼或眼球转动等习惯动作,都和他本人如出一辙。2010年,石黑浩制造了一款外形似20多岁的日俄混血女性的机器人“Gemnoid F”。它采用一种动作捕捉系统,能够做出眨眼、微笑、皱眉等65种不同面部表情,皮肤由柔软的硅胶研制,肤色逼真度极高,更能像真人发声、对话和唱歌等。同一年,石黑浩还展示无腿便携式通信机器人“Telenoid R1”。这款机器人可以模仿我们在千里之外的亲朋好友的声音和表情,可以让人们远距离“聊天”。2011年,石黑浩团队对Telenoid R1进行了“压缩”,将其变成一部只有8英寸长的微缩版人体触感手机“Elfoid P1”。它能与用户交互,通过内置在眼睛中的摄像头和一整套动作感应系统,Elfoid P1可以捕捉并判断用户的动作、表情,进而分析用户的情绪并做出自己的反应。2015年,石黑浩团队开发了第一个完全自主的机器人“A”。凭借语音识别、红外人体追踪、语音合成和自然运动生成等技术让“她”可以保持10分钟的谈话,声音和表情都非常接近人类。曾两次想自杀石黑浩很少提及他的个人生活,但是,由于经常出差,再加上自己制定的每个工作日工作16小时,可以想象得出:他和妻子的生活相当独立。石黑浩本人也承认:“我们的原则很简单,她从不过问我的工作,我也从不关注她的业务爱好。”石黑浩还称,他曾两次认真地考虑过自杀。一次是他36岁时,当时他的一位得意门生在一次计算机编程竞赛中战胜了他。另一次是十年后,当时他的另一位学生在撰写技术论文方面比他更出色。这两次,他都通过换个新角度来看待自己的工作,以此来排解郁闷。但与此同时,这两次事件也凸显了他的恐惧,他担心自己无法阻止思想的慢慢变老。他也意识到,自己的注意力不能再像以前那样专注了。老年痴呆是他最担心的问题。他说:“也许我找不到任何理由在这个世界上生存下去。我不喜欢这样想象。 ”片刻安静之后,他又接着说:“你知道什么是灵魂吗?灵魂并不是那么个人化,在日本,但我们去世后灵魂会回到同一个地方,回到大山。我们现在活得比较个人化,都拥有自己的灵魂。但去世后,我们就会共享一些事情。灵魂将回到一个地方,聚集在一起。因此,灵魂并不孤独。”一个周六的晚上,记者在美并(Minami)商业区见到了石黑浩和巴勒莫大学(University of Palermo )机器人学教授罗萨里奥·索尔贝洛(Rosario Sorbello),并一同享受街头小吃。与机器人性爱在石黑浩滚动手机屏幕时,索尔贝洛谈起了与机器人性爱的话题,这也是他思考已久的问题。他说:“你想过那将是一种怎样的情景吗?你愿意去亲吻一个机器人吗?亲吻它的橡胶皮肤?相信有人会有这样愿望。再想象一下;你是否可以把热量传给它的皮肤,以至于触摸起来不会有冰凉感?相信有人愿意去尝试。”“人类的性和浪漫关系不可避免地会出现混乱,因此许多人希望让生活变得简单。在这种情况下,与机器人保持关系可能就是一个解决方案。 我认为,这就是未来的发展趋势。”性可以说是人类联系的最终物理行为,但也可能仅仅是:一种行为,一种亲密的模拟。性可以被认为是超越纯粹物质的东西,在现实生活中,它主要是一种身体体验,而不是我们装出来的一种亲密体验。从这个角度讲,至少在理论上,可以用机器人来复制一系列性体验。在索尔贝洛的推荐下,记者后来阅读了人工智能专家大卫·利维(David Levy)2007年一本著作《与机器人的爱与性》(Love and Sex With Robots)。这本书认为,人类与机器人交友、性爱,甚至是结婚,并不是遥不可及的事情。这一切都取决于我们是否愿意相信机器人的情感生活和愿望。机器人在设计之初就考虑到了人类喜欢的身体比例、声音、眼睛颜色和性格类型,并且能回忆起主人的生活片段和小笑话段子,机器人势必将吸引人类的关注,并捕获人心。利维在书中称:“如果一个机器人的行为好像有感觉,我们能合理地争辩说它没有吗?如果一个机器人的智能情感促使它说‘我爱你’,人类也应该愿意接受。其实,与智能机器一样,人类也是一种‘程式化’动物。”换言之,利维认为,我们的内在从本质上将也是基于算法的,这与人工智能没太大区别。他说,数十年之后,人类与机器人之间的区别,可能也就相当于来自不同国家,或同一个国家不同地区之间的文化差异罢了。 至于与机器人性爱,利维认为,它将成为那些与社会孤立人群的一种慰藉,也是那些配偶生病或外出旅游人群的一种可接受的性行为。当然,这些是关于人性和性爱的一些激进想法。但是,对于那些有需要的人群,如天各一方,有人能够提供合法宽慰,有什么理由不接受呢?其实,我们之中的大部分人已经接受通过技术来解决之前相对简单且直接的人类交互,那么这两者之间又有什么真正的不同吗?石黑浩认为,人类与机器人性爱,肯定将成为未来社会的一部分,只是时间早晚的问题。他也知道,自己的研究对人机性爱具有推动作用。但是,他的研究主要以学术为主,他需要一个非商业化、旨在改善社会的理由来追求这一目标。石黑浩说,例如为了部分残障人士。石黑浩开发的机器人大部分为漂亮的女性机器人,当被问及原因时,他说,他的最终目的就是让人们接受机器人进入人类生活中。“那么哪一种机器人最容易被大多数人接受呢,美丽的女人还是丑陋的呢?”(编译/谭燃)
正文已结束,您可以按alt+4进行评论
责任编辑:yannyzhou
扫一扫,用手机看新闻!
用微信扫描还可以
分享至好友和朋友圈
Copyright & 1998 - 2018 Tencent. All Rights Reserved  从阿法狗战胜李世石,到前几天有个仿真美女机器人声称要摧毁全人类,最近的人工智能真的非常火啊。  什么?你不喜欢机器人?  她/他们好可爱好吗!  未来的机器人能帮我们做些什么事呢?懒惰的同学就动心思了,特别是那些特别不喜欢做饭的,讨厌吃完还要刷碗的......  是的,这些患了懒癌症的人,你们有救了......  今天我来介绍“世界上第一款自动化厨房”的机器人,是英国机器人创业公司Moley robotics研发出一款厨房机器人。这是会做饭的机械手:  别看她是机器就以为她很粗鲁,其实啊,她可温柔了。  她能够悠然地夹菜:也可以优雅地用杯子去盛液体:说了会做饭,当然会切肉啦:啧啧,再来看看这分开肉丝的动作,都带着成熟女人的韵味......比女人还女人啊!她既可以翻:也可以用奶油画出一个”爱心“:搅拌起来也不含糊呢:能分好饭:更精彩的是,完后还能把厨房清洁也搞了。。。高潮来了,她还能把盘子收起来:  妈呀,这个机器人太变态!  连做饭都做出自动化来了啊......  其实没有什么技能是天生就会的嘛,那么这款机器人是怎么学会做饭呢?  她做饭做得似模似样,其实都是模拟人的动作。她的两个机械手非常灵活,她有20个电动马达,24个关节和129个传感器。她有2000多套菜谱,能做2000多道菜。所以你可以想吃什么就在操作屏幕上点菜就行了。  既然是人工智能,她当然有不断学习的能力,它通过视觉系统会捕捉的各种动作、时间并进行记录,最后生成一套自己的做饭程序。  你可以yy一下:  夜深了,饿了,不想亲自煮,也懒得去买宵夜,只要点点屏幕就好了:  “喂,给我来个方便面,我饿了。”  噢,对了,这货在明年才会发售,价格大概是1.5万美元。  --完--  更多精彩文章,请关注“庖丁技术”微信公众号:pdtechnology(长按复制),每天都有一篇前沿科技文章分享。  推荐阅读爱迪生用尽毕生手段打压他,仍不能阻止特斯拉改变世界!  分享到:  0 个人觉得赞好文章 点个赞您已经赞过了+1心得丨要成为机器人工程师应该学些什么?(大一、大二篇) - 机器人论坛 -
中国电子技术论坛 -
最好最受欢迎电子论坛!
后使用快捷导航没有帐号?
心得丨要成为机器人工程师应该学些什么?(大一、大二篇)
13:53:46  
本帖最后由 vinsh 于
14:00 编辑
最近,人工智能爱好者俱乐部的群里一直有人在问,我对人工智能很感兴趣,很想从事人工智能,但是,我不知道从哪里下手,不知道从何学起,在此,小编特意在网上搜罗了一下,刚好有一篇大一、大二学生进军机器人领域的文章,特意节选拿来分享给大家,希望对刚刚步入大学殿堂或者想要从事机器人学习的朋友能有一点启发!根据世界第一的机器人教育机构卡耐基梅隆大学的机器人学博士的课程分类方式,机器人学有四个核心领域:
在真正开始谈该怎么做之前,笔者给了大家一些善意的提醒:
但是,小编想插播一个消息。
关于笔者善意的提醒和爱的忠告就到这里了,接下来开始介绍如何才能成为一名机器人工程师。
小编将整个大一需要学习的整理为五大点
翻墙必须要翻墙,先确保自己能上Google。这能让你在之后的职业生涯里节省上万块钱,所以别心疼买VPN的钱。注册一个Gmail账号再注册stackoverflow账号再注册github的账号再注册CSDN账号注册完多登录上去逛逛...
英语水平会影响机器人工程师水平。一些高级的机器人知识都不是中文的参考资料,这个时候如果啃不下英文资料,进步速度和眼界就会受到很大影响。因此大一的时候要多看看红宝书,看看美剧。
线性代数线性代数的重要性需要特别强调,优秀的工程师和科学家在职业生涯中要学至少五次线性代数。对学习线性代数推荐两书一教材:《Linear Algebra Done Right》《Linear Algebra Done Wrong》麻省理工公开课:线性代数。[2]不论如何,学线性代数一定要用国外的教材,千万不要用国内的教材,就算是英文也要啃下来,同时还要刷足够多的课后题。
编程不管学的专业是什么,一定要在大学一年级尽早开始学编程。推荐从Python开始学习编程,比较好的Python开发学习环境是Anacoda 。比较好的教材是麻省理工学院公开课:计算机科学及编程导论。Python就像一把瑞士军刀,功能很多。但是真要去造机器人,合适的工具并不是瑞士军刀,而是C/C++这样简单粗暴的锤子和螺丝刀般的工具。笔者个人入门用的是清华大学出版的《C++语言程序设计》。不过国内的C语言教材都有个巨大的问题是不引导学生去用Linux。
Makefile当你把C学得差不多,开始要学写包含多个头文件的程序时,一定要同时学习makefile的知识。这时候要上网去搜“Makefile详解”。
笔者个人觉得HTML和Javascript也是机器人工程师必备的技术。因为web技术实际上已经渗透到了编程的方方面面。另外AJAX能够帮助初学者理解一定的网络技术原理,而网络技术也是机器人工程师必备的技能。
上大二的时候,你已经学会了基本的编程知识和基本的数学知识。机器人工程师需要的技能数量是IT行业全栈工程师技能数量的三倍以上,这些技能的基础都应该在大二开始积累。
大二应该掌握的技能
大二阶段特别要强调的是对动手能力的培养,包括机械材料的加工、电路焊接、制作导线和接头、连接路由器、配置网络、做网线等等。
在动手前,你需要准备以下工具~
对于该选择造一个怎么样的“真正能用的机器人”练手,最好的选择肯定是机器人比赛中的机器人。参加Robocon,你会学着造有人那么高的巨大机械;参加RoboMasters,你会学着造比汽车还要灵活的机器人。其他一些小型的比赛比如飞思卡尔智能车,也是很好的训练。
国内开源机器人社区也有很多资源可以利用来学习,比如自己买Arduino STEM educational Robot kits Building Platform的各种开发套件做简单的机器人。
如果更希望接触到单片机的本质,可以自己买STM32开发板学习。STM32是ARM Cortex?M家族中最为广泛应用的一款单片机,在网上也有很多的教材和开发板可供选择。在国内著名的电子论坛STM32/8 分论坛上,有很多参考资料。
大二的暑假,可以跟着学校的机器人队参加了一些机器人比赛,也可以自己做一个舵机机器人,比如六足机器人。舵机是机器人工程师的好朋友,一定要好好掌握。
但是,大二要做的,远远不止参加机器人比赛。
大二结束的时候,你的Linux应该用的很熟练了,除了makefile,你也用起了cmake。你还应该有做到...
3000行代码学校应该给大二到大三的学生有开设面向对象的程序设计,一般用Java或C++。在面向对象的程序课里面,一定要积累3000行左右的代码的开发经验。经典的程序设计练习通常是写游戏,比如俄罗斯方块,吃豆人等等,一定要自己能够做到完全手写一个完整的项目出来。
倒立摆在大二这一年的学习中,你的课程里多多少少用到了Matlab。要注意的是,Matlab最强大的工具是Simulink,通过它你几乎可以仿真一切的物理系统和控制系统。笔者建议同学可以通过Simulink实现一个倒立摆。倒立摆是机器人学中一个非常重要的模型,因为火箭、导弹、双足机器人、四足机器人,基本都是倒立摆的变形。自己做出来的simulink模型一定要存好哦~
本帖子中包含更多资源
才可以下载或查看,没有帐号?
09:11:47  
LZ你好!刚读了你的帖子,深感佩服!关于机械臂有问题请教下!
公司最近开发的一台设备要实现4台步进电机的4轴联动并具备示教功能,本人大学毕业11年,从事机械设计工作,对PLC控制了解些皮毛。
请问LZ,我需要学习哪些知识才可以实现以上功能?现在实在不知道从哪里下手
本帖子中包含更多资源
才可以下载或查看,没有帐号?
10:05:53  
我噻,准备那么多啊
10:06:03  
很复杂的了哦,加油啊
10:57:05  
楼主你好,我是学电气工程的,在你所说的这些科目里面,我感觉除了python和网络配置这块不太了解,其他的基本了解,但是现在不知道该怎么入手,学校比较low,没有机器人社团,只做了一些电子设计,希望能给点建议,谢谢。
只有小组成员才能发言,
606个成员聚集在这个小组
创建小组步骤
创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐
Powered by
供应链服务
版权所有 (C) 深圳华强聚丰电子科技有限公司尊敬的极客用户,您好!
感谢您一直关注并使用极客头条,为了给您带来良好的体验效果及性能,极客头条将于日关闭,您可以在
中继续使用发布文章功能并看到已经发布成功的文章。
主题信息(必填)
主题描述(最多限制在50个字符)
申请人信息(必填)
申请信息已提交审核,请注意查收邮件,我们会尽快给您反馈。
如有疑问,请联系
CSDN &《程序员》研发主编,投稿&纠错等事宜请致邮
你只管努力,剩下的交给时光!
如今的编程是一场程序员和上帝的竞赛,程序员要开发出更大更好、傻瓜都会用到软件。而上帝在努力创造出更大更傻的傻瓜。目前为止,上帝是赢的。个人网站:www.xttblog.com。个人QQ群:、
个人大数据技术博客:https://www.iteblog.com
作者:张俊林,中科院软件所博士,技术书籍《这就是搜索引擎:核心技术详解》、《大数据日知录:架构与算法》作者。曾担任阿里巴巴、百度、新浪微博资深技术专家,目前是用友畅捷通工智能相关业务负责人,关注深度学习在自然语言处理方面的应用。
责编:周建丁()
本文为原创文章,未经允许不得转载,更多精彩文章请
聊天机器人(也可以称为语音助手、聊天助手、对话机器人等)是目前非常热的一个人工智能研发与产品方向。很多大型互联网公司投入重金研发相关技术,并陆续推出了相关产品,比如苹果Siri、微软Cortana与小冰、Google Now、百度的“度秘”、亚马逊的蓝牙音箱Echo内置的语音助手Alexa、Facebook推出的语音助手M、Siri创始人新推出的Viv……究其原因在于大家都将聊天机器人定位为未来各种服务的入口,尤其是移动端App及可穿戴设备场景下提供各种服务的入口。聊天机器人的类型目前市场上有各种类型的聊天机器人,比如有京东JIMI客服机器人,儿童教育机器人,小冰娱乐聊天机器人,Alexa家居控制、车载控制机器人,Viv全方位服务类型机器人等。这是从应用方向对聊天机器人的一种划分。如果对应用目的或者技术手段进行抽象,聊天机器人可以有以下两种划分方法。
目标驱动(Goal Driven) VS. 无目标驱动(Non-Goal Driven)聊天机器人
目标驱动的聊天机器人指的是聊天机器人有明确的服务目标或者服务对象,比如客服机器人、儿童教育机器人、类似Viv的提供天气/订票/订餐等服务的服务机器人等,这种目标驱动的聊天机器人也可以称作特定领域的聊天机器人。无目标驱动聊天机器人指的是聊天机器人并非为特定领域服务目的而开发,比如纯粹聊天或者出于娱乐聊天目的以及计算机游戏中的虚拟人物聊天机器人都属于此类。这种无明确任务目标的聊天机器人也可以称作为开放领域的聊天机器人。
检索式 VS. 生成式聊天机器人
检索式聊天机器人指的是事先存在一个对话库,聊天系统接收到用户输入句子后,通过在对话库中以搜索匹配的方式进行应答内容提取。很明显,这种方式对对话库要求很高,需要对话库足够大,能够尽量多地匹配用户问句,否则会经常出现找不到合适回答内容的情形(因为在真实场景下用户说什么都是可能的),但它的好处是回答质量高,因为对话库中的内容都是真实的对话数据,表达比较自然。生成式聊天机器人则采取不同的技术思路,在接收到用户输入句子后,采用一定技术手段自动生成一句话作为应答,这个路线机器人的好处是可能覆盖任意话题的用户问句,但是缺点是生成应答句子质量很可能会存在问题,比如语句不通顺、句法错误等看上去比较低级的错误。本文重点介绍开放领域、生成式的聊天机器人如何通过深度学习技术来构建,很明显这是最难处理的一种情况。好聊天机器人应该具备的特点一般而言,一个优秀的开放领域聊天机器人应该具备如下特点:首先,针对用户的回答或者聊天内容,机器人产生的应答句应该和用户的问句语义一致并逻辑正确,如果聊天机器人答非所问或者不知所云,或者总是回答说“对不起,我不理解您的意思”,无疑是毁灭性的用户体验。其次,回答应该语法正确。这个看似是基本要求,但是对于采用生成式对话技术的机器人来说其实有一定困难,因为机器人的回答是一个字一个字生成,要保证这种生成的若干个字句法正确,并不容易做得那么完美。再次,应答应该是有趣、多样而非沉闷无聊的。尽管有些应答看上去语义没什么问题,但目前技术训练出的聊天机器人很容易产生“安全回答”的问题,就是说,不论用户输入什么句子,聊天机器人总是回答“好啊”、“是吗”等诸如此类,看上去语义说得过去,但是这给人很无聊的感觉。此外,聊天机器人应该给人“个性表达一致”的
感觉。因为人们和聊天机器人交流,从内心习惯还是将沟通对象想象成一个人,而一个人应该有相对一致的个性特征,如果用户连续问两次“你多大了”,而聊天机器人分别给出不同的岁数,那么会给人交流对象精神分裂的印象,这即是典型的个性表达不一致。而好的聊天机器人应该对外体现出各种基本背景信息以及爱好、语言风格等
方面一致的回答。几种主流技术思路当前聊天机器人的几种主流技术包括:基于人工模板、基于检索、基于机器翻译技术,以及基于深度学习的聊天机器人。基于人工模板的技术通过人工设定对话场景,并对每个场景编写针对性的对话模板,模板描述了用户可能的问题以及对应的答案。这个技术路线的好处是精准,缺点是需要大量人工工作,而且可扩展性差,需要一个场景一个场景去扩展。目前市场上各种类似于Siri的对话机器人中都大量使用了人工模板的技术,但其精准性是其他方法还无法比拟的。基于检索技术的聊天机器人则走的是类似搜索引擎的路线,事先存储好对话库并建立索引,根据用户问句,在对话库中进行模糊匹配找到最合适的应答内容。基于机器翻译技术的聊天机器人把聊天过程比拟成机器翻译过程,就是说将用户输入聊天信息Message,翻译成聊天机器人应答Response的过程类似于把英语翻译成汉语。基于这种假设,就完全可以将统计机器翻译领域相对成熟的技术直接应用到聊天机器人开发中来。基于深度学习的聊天机器人技术是本文后续内容主要介绍的技术路线,总体而言,绝大多数技术都是在Encoder-Decoder(或者称作Sequence to Sequence)深度学习技术框架下改进的。使用深度学习技术来开发聊天机器人相对传统方法来说,整体思路非常简单并可扩展。利用深度学习构建聊天机器人如上所述,目前对于开放领域生成式聊天机器人技术而言,多数采用了Encoder-Decoder框架,所以这里首先描述Encoder-Decoder框架技术原理。然后分别针对聊天机器人研究领域需要特殊考虑的主要问题及其对应的解决方案进行讲解,这些主要问题分别是:多轮会话中的上下文机制、“安全回答”以及个性信息一致性问题。Encoder-Decoder框架Encoder-Decoder框架可以看作一种文本处理领域的研究模式,应用场景异常广泛,不仅可用在对话机器人领域,还可以应用在机器翻译、文本摘要、句法分析等各种场合。图1是文本处理领域里常用的Encoder-Decoder框架最抽象的一种表示。Encoder-Decoder框架可以直观地理解为适合处理由一个句子(或篇章)生成另外一个句子(或篇章)的通用处理模型。对于句子对(X,Y),我们的目标是给定输入句子X,期待通过Encoder-Decoder框架来生成目标句子Y。X和Y可以是同一种语言,也可以是两种不同的语言。而X和Y分别由各自的单词序列构成:Encoder顾名思义就是对输入句子X进行编码,将输入句子通过非线性变换转化为中间语义表示C:对于解码器Decoder来说,其任务是根据句子X的中间语义表示C和之前已经生成的历史信息y1,y2……yi-1来生成i时刻要生成的单词yi:
图1 抽象的Encoder-Decoder框架每个yi都依次这么产生,那么看起来就是整个系统根据输入句子X生成了目标句子Y。对于聊天机器人来说,完全可以使用上述的Encoder-Decoder框架来解决技术问题。具体而言,对应的多轮会话中的上下文问题利用上述Encoder-Decoder框架,聊天机器人可以根据用户当前输入Message自动生成应答Response,形成了一个有效的对话系统。但是一般人们聊天并不是单纯的一问一答,回答的内容常常要参考上下文信息Context,也就是在用户当前输入问句Message之前两者的对话信息。因为存在多轮的一问一答,这种情形一般称为多轮会话。深度学习解决多轮会话的关键是如何将上下文聊天信息Context引入到Encoder-Decoder模型中。Context应该引入到Encoder中,因为这是除了当前输入Message的额外信息,有助于Decoder生成更好的应答Response。目前不同的研究主体思路都是这样,无非如何将Context信息在Encoder端建立模型或者说具体的融入模型有些不同。表1 聊天机器人聊天效果示例
在上文所述的Encoder-Decoder框架中,很容易想到一种直观地将Context信息融入Encoder的思路:无上下文信息的Encoder-Decoder模型的输入仅仅包含Message,只需要把上下文信息Context和信息Message拼接形成一个长的输入提供给Encoder,这样就把上下文信息融入模型中了。这个直觉本身没有什么问题,但是对于采用RNN模型的Encoder来说,这种方式使得有时候输入非常长,而对于RNN模型来说,输入的线型序列长度越长,模型效果越差。所以简单地拼接Context和Message的策略不会产生太好的聊天效果。考虑到RNN对长度敏感的问题,文献3提出了针对聊天机器人场景优化的Encoder-Decoder模型,核心思想是将Encoder用多层前向神经网络来代替RNN模型,神经网络的输出代表上下文信息Context和当前输入Message的中间语义表示,而Decoder依据这个中间表示来生成对话Response。这样做既能够将上下文信息Context和当前输入语句Message通过多层前向神经网络编码成Encoder-Decoder模型的中间语义表达,又避免了RNN对于过长输入敏感的问题。图2和图3是论文中提出的两种不同的融合方法,方法1对Context和Message不做明显区分,直接拼接成一个输入;而方法2则明确区分了Context和Message,在前向神经网络的第一层分别对其进行编码,拼接结果作为深层网络后续隐层的输入,核心思想是强调Message的作用,因为毕竟Response是针对Message的应答,Context只是提供了背景信息,所以应该突出Message的作用。当然,除了Encoder从RNN替换为深层前向神经网络外,文献3与传统Encoder-Decoder还有一个显著区别,就是Decoder的RNN模型每个时刻t在输出当前字符的时候,不仅仅依赖t-1时刻的隐层状态和当前输入,还显示地将Encoder的中间语义
编码直接作为t时刻RNN节点的输入,而不是像经典Encoder-Decoder模型那样把中间语义编码当做Decoder中RNN的最初输入。其出发点也很直观,就是在生成每个输出字符时反复强化中间语义编码的作用,这对于输出应答Response较长的情况是有帮助的。文献4给出了解决多轮会话上下文问题的另外一种思路(如图4所示),称作层级神经网络(Hierarchical Neural Network,简称HNN)。HNN本质上也是Encoder-Decoder框架,主要区别在于Encoder采用了二级结构,上下文Context中每个句子首先用“句子RNN(Sentence RNN)”对每个单词进行编码形成每个句子的中间表示,而第二级的RNN则将第一级句子RNN的中间表示结果按照上下文中句子出现先后顺序序列进行编码,这级RNN模型可称作“上下文RNN(Context RNN)”,其尾节点处隐层节点状态信息就是所有上下文Context以及当前输入Message的语义编码,以这个信息作为Decoder产生每个单词的输入之一,这样就可以在生成应答Response时把上下文信息考虑进来。综上所述,深度学习解决多轮会话的上下文信息问题时大致思路相同,都是在Encoder阶段把上下文信息Context及当前输入Message同时编码,从而可以参考上下文信息生成应答Response。解决“安全回答”(Safe Response)问题如果采用经典的Encoder-Decoder模型构建开放领域生成式聊天机器人系统,一个比较容易产生的严重问题就是“安全回答”。就是说不论用户说什么内容,聊天机器人都用少数非常常见的句子进行应答,比如英文的“I don’t know”、“Come on”、“I’ m OK”,中文的“是吗”、“呵呵”等。虽然很多种情况下这么回答也不能说是错误的,但可以想象,如果用户遇到这样一位聊天对象会有多抓狂。这个现象产生的主要原因是聊天训练数据中确实有很多这种宽泛而无意义的应答,所以机器人通过Encoder-Decoder模型学会这种常见应答模式。如何解决聊天机器人“安全回答”问题,让机器产生多样化的应答是个重要的课题。
图2 融合方法1
图3 融合方法2
图4 层级神经网络文献5即在Sequence-to-Sequence框架下来解决“安全回答”问题。在聊天场景下,使用Sequence-to-Sequence框架来进行模型训练时,传统的优化目标基本上是最大似然法(MLE),就是说给定用户输入Message,通过训练来最大化生成应答Response的概率:其中M代表message,R代表Response。文献X提出了改进的优化目标函数:最大化互信息(MMI),其目标函数如下:可以从公式差异中看出,MMI的优化目标除了最大化从Message生成应答Response的概率,同时加入了反向优化目标,即最大化应答Response产生Message的概率(即log p(M|R)部分),是控制两者哪个更重要的调节超参数。通过其名称“互信息”以及具体公式可以看出,这个优化目标函数要求应答Response和Message内容密切相关而不仅仅是考虑哪个Response以更高概率出现,从而降低了那些非常常见的回答的生成概率,使得应答Response更多样化且跟Message语义更相关。采用MMI作为目标函数明显解决了很多“安全回答”问题,表2是两个不同优化目标函数产生的应答Response的示例,其中Message列代表用户输入语句Message,S2S Response代表MLE优化目标产生的应答,MMI Response代表MMI优化目标产生的应答。表2 S2S与MMI产生的应答
个性信息一致性问题对于聊天助手等应用来说,聊天机器人往往会被用户当做一个具有个性的虚拟人,比如经常会问“你多大了”、“你的爱好是什么”、“你是哪里人啊”等问题。如果将聊天助手当做一个虚拟人,那么这位虚拟人相关的年龄、性别、爱好、语言风格等个性特征信息应该维护回答的一致性。利用经典的Sequence-to-Sequence模型训练出的聊天助手往往很难保持这种个性信息的一致性(不一致的例子请参考图5),这是因为Sequence-to-Sequence模型训练的都是单句Message对单句Response的映射关系,内在并没有统一维护聊天助手个性信息的场所,所以并不能保证相同的问题每次能够产生完全相同的应答。另外,对于海量用户来说,可能不同的用户会喜欢不同聊天风格或者不同身份的聊天助手,所以聊天机器人应该能够提供不同身份和个性信息的聊天助手,不同类型用户可以采用相应类型的聊天助手来聊天,当然,在聊天过程中要尽量保持身份和个性信息的一致性。那么如何在Sequence-to-Sequence框架下采用技术手段维护聊天助手的个性信息一致性呢?文献6给出了一种比较典型的解决方案,我们可以改造出一个能够实现不同身份个性特征的聊天助手思路。图6是其示意图(注意:本文叙述的并非文献6中的原始场景,而是本文作者参照文献稍作修正的技术方案)。其基本思路如下:聊天机器人系统可以定义不同身份、个性及语言风格的聊天助理,个性化信息通过Word Embedding的表达方式来体现,在维护聊天助手个性或身份一致性的时候,可以根据聊天对象选择某种风格、身份的聊天助手。整体技术框架仍然采用Sequence-to-Sequence架构,其实现思路是把聊天助手的个性信息导入到Decoder的输出过程中,就是说在采用RNN的Decoder生成应答Response的时候,每个t时刻,神经网络节点除了RNN标准的输入外,也将选定身份的个性化Word Embedding信息一并作为输入。这样就可以引导系统在输出时倾向于输出符合身份特征的个性化信息。上述是一种深度学习框架下维护聊天助手个性一致的技术框架,很明显还可以衍生出很多种其他方案,但是技术思路应该是类似的,核心思想是把聊天助手的个性信息在Decoder阶段能够体现出来,以达到维护个性一致的目的。小结上述内容介绍了使用深度学习构建聊天机器人采用的主体技术框架以及面临的一些独特问题及相应的解决方案。此外,还有一些问题值得探讨,比如如何使得聊天机器人有主动引导话题的能力,因为一般聊天机器人都比较被动,话题往往都是由用户发起和引导,聊天机器人只是作为应答方,很少主动引导新话题,而这很容易导致聊天冷场,所以如何主动引导话题也是聊天机器人应该具备的能力之一,文献7提出了一种技术方案,此处不赘述,感兴趣的读者可自行参考。
图5 个性信息不一致问题(这是利用Twitter 2500万训练数据经过Sequence-to-Sequence模型训练后产生的结果)
图6 一种Sequence-to-Sequence框架下维护聊天助手个性信息一致性的方案深度学习聊天机器人的优点与需要改进的方向相对基于检索类或者机器翻译类传统技术而言,基于Encoder-Decoder深度学习框架的聊天机器人具有如下明显优点:
构建过程是端到端(End-to-End)数据驱动的,只要给定训练数据即可训练出效果还不错的聊天系统,省去了很多特征抽取以及各种复杂中间步骤的处理,比如省去句法分析与语义分析等传统NLP绕不开的工作,使得系统开发效率大幅提高。
语言无关,可扩展性强。对于开发不同语言的聊天机器人来说,如果采用Encoder-Decoder技术框架,只需要使用不同语言的聊天数据进行训练即可,不需要专门针对某种语言做相关的特定优化措施,这使得系统可扩展性大大加强。
训练数据扩大有助于持续提升系统效果。对于Encoder-Decoder深度学习模型来说,一般通过不断增加训练数据就能够带来持续的效果提升。
当然,开发出具备像人一样能够自然交流的聊天机器人目前还面临着各种技术难题,具体到使用深度学习技术来构建聊天机器人来说,目前在以下几个方面还需大力加强:
聊天机器人的评价标准。聊天机器人效果质量的评价标准对于持续提升系统是至关重要的,因为只有这样才能有针对性地设计技术方案进行改进。聊天机器人在评价标准方面还有待深入研究,目前常用的标准包括机器翻译的评价指标BLEU、语言模型评价标准困惑度等,还有很多工作是通过人工来进行效果评价,还没有特别合适的专用于聊天机器人的评价标准,这是阻碍聊天机器人技术持续发展的一个障碍。
缺乏标准化的大规模训练数据。就像上述深度学习模型优点所述,训练数据的不断增加一般能够带来性能的持续提升。但是目前来说,标准化的特大规模人与人对话数据相对缺乏,很多研究都是通过Twitter或者微博评论等高成本的采集方式来收集对话训练数据,或者使用电影字幕等比较间接的方式来积累训练数据。如果能够有大规模的标准聊天数据,很明显将能够极大促进技术进步。
技术仍处于发展初期。很明显采用深度学习来构建聊天机器人的技术研发还处于非常初期的阶段,技术手段也好,实际系统效果也好,都有非常大的进步空间。
参考文献:[1]Lifeng Shang, Zhengdong Lu, and Hang Li.2015. Neural responding machine for short-text conversation. In ACL-IJCNLP, pages .[2] Oriol Vinyals and Quoc Le. 2015. A neural conversational model. In Proc. of ICML Deep Learning Workshop.[3] Alessandro Sordoni, Michel Galley, Michael Auli, ChrisBrockett, Yangfeng Ji, Meg Mitchell,Jian-Yun Nie,Jianfeng Gao, and Bill Dolan. 2015.A neural network approach to context-sensitive generation of conversational responses. In Proc. of NAACL-HLT.[4] Iulian V Serban, Alessandro Sordoni, Yoshua Bengio,Aaron Courville, and Joelle Pineau. 2015. Building end-to-end dialogue systems using generative hierarchical neural network models. In Proc. of AAAI.[5]Jiwei Li, Michel Galley, Chris Brockett, Jianfeng Gao,and Bill Dolan. 2015. A diversity-promoting objective function for neural conversation models. arXiv preprint arXiv:15[6] Jiwei Li, Michel Galley, Chris Brockett, Jianfeng Gao and Bill Dolan. A Persona-Based Neural Conversation Model. arXiv preprint arXiv:16[7] Xiang Li,Lili Mou,Rui Yan and Ming Zhang. StalemateBreaker: A Proactive Content-Introducing Approach to Automatic Human-
Computer Conversation.IJCAI 2016.订阅2016年程序员(含iOS、Android及印刷版)请访问
订阅咨询:o 在线咨询(QQ):
o 电话咨询:010-
o 更多消息,欢迎关注“”

我要回帖

更多关于 迷你世界怎么造机器人 的文章

 

随机推荐