你会使用人工智能技术是什么来匹配你的伴侣吗?


编辑导语:婚姻与爱情可以由AI来匹配决定吗?当下,人们的时间相对被压缩,物质、精神生活的丰富以及生活压力对时间的挤压,展开、建设一段亲密关系于人们而言似乎变得有些奢侈。那么,人工智能可以帮助我们建立一段爱情或婚姻关系吗?本文就此进行了探讨,一起来看一下。
《黑镜》系列大多以黑色幽默的方式,表达对AI的悲观态度,但其中也带给我们很多关于AI影响的思考与想象。
《黑镜》第四季中有个故事:在AI技术非常成熟的未来,人们谈恋爱结婚只能依靠AI,约会对象、相处时间都由机器匹配决定,系统会通过算法分析个人数据找到匹配率99.8%的完美对象。
你的真命天子/天女可以通过机器来解决,听起来的确很美好,但是这种AI技术是一种概率的计算,对于难以言说的人互相吸引的微妙情愫难以把控。
现代社会的生活节奏,人与人之间的相处模式与没有互联网的那个时代截然不同。对于婚姻、爱情的关系来说,可以借鉴或者是可以模仿的方式,需要重新讨论和探索。吸引人精力的东西太多,影视、书籍、游戏等,时间与效率越来越被看重。开展一段关系、探索爱情这些都变得奢侈起来。
越来越多的人选择晚婚,长时间的空窗,归根结底还是因为很难遇到合适的人建立关系。
有没有像黑镜那样比较智能的系统,帮我们去筛选一些潜在的伴侣呢?人工智能对于爱情、婚姻中的关系能不能起到促进的作用?
一、AI月老已成现实
在大数据最火的时候,也有一些应运而生的相亲匹配应用,比如世纪佳缘、百合网等都推出自己的智能匹配系统,根据用户输入的年龄、住址、年薪、兴趣、消费习惯等数据来进行速配。
这种速配的方式非常粗糙,对于大多数来说,情感最终的诉求是思想层面匹配后的爱意,不是源于对物质的吸引。大数据推荐匹配的结果就是获得了一众的吐槽。
日本这两年研发了个AI婚配系统,目前展示出来的成果值得让人一试。这个AI婚配系统是由政府牵头解决日本少子化的问题而开展的项目。目前日本全国共有15个县市导入了AI婚配系统。其中一处试点埼玉县,自2018年引入“邂逅支援中心”后共促成了69对婚姻,其中的33对都是通过AI婚配系统找到另一半的。因为项目的进展良好,日本政府打算在2021年向全国主推这个婚配系统。
该AI婚配系统没有黑镜中的那么暗黑,只需要采集个人信息、求偶条件信息,价值观测试等,AI就可以根据你的个人情况进行推荐。与其他婚恋推荐系统最大的区别就是这个价值观测试的部分,精心设计的题目达上百条,据悉测试价值观部分就得花费半个小时的时间。
该AI婚配算法的优势之处在于以价值观测试报告作为基础,挑选出三观一致的有缘人,不完全重视配对者的外在条件(比如收入、学历、身高),而是将两个人在长期交往中才能体现出来的兴趣、价值观纳入算法模型当中,优先进行考虑。
不过,这套AI系统也是有bug的,因为系统只是根据用户的价值观答案进行婚恋对象的匹配,如果遇到一些精心伪装过的骗子或者是会营造人设类似吴签的鸡贼渣,就无法辩别了。放到国内这个鱼龙混杂的环境内,可能会“套路”算法被玩坏。
AI婚配系统契合度会以星级打分进行评价,让你找到觉得相处更融洽、性格更合适的人,节约磨合价值观兴趣的沟通成本,加速了价值观筛选的过程。所以有这样的系统还是一件好事,匹配合适的备选对象,自己再去实际相处甄别,比盲目去刷量相亲好得多。
脱单在一段感情中是最基本也是最耗费心力的阶段,需要观察、磨合等, AI技术加持对于脱单来说,还是神助攻般的存在。算法匹配可以帮助用户筛选出更有好感度的人,技术可以更有效率的创造遇到爱情的机会,且在不断学习的过程中持续提高这种概率。正是有了潜在的结婚对象后,后面感情的深入进展才会有发生的机会。
二、情感触礁,有AI帮忙
人类的悲欢在爱情里面还是比较相似的,无论是多契合的灵魂,伴侣之间还是会在关系深入的阶段因为一些事情产生摩擦,谁的情感、婚姻里面没有发生过冲突呢?处理得好的话,冲突反而是成就关系的粘合剂,但是对于大多数人来说,冲突是关系的裂痕。如果利用AI 算法来减少或者处理伴侣吵架的问题,有没有可能呢?
AI为人类的鸡毛蒜皮也是操碎了心。一个由四名工程师和心理学家组成的小组,联手打造了个AI 系统,该系统能够预测夫妻之间即将爆发的冲突,预测准确率高达 79.6%,不仅如此,它还会及时劝架。
这几位研究人员所开发的 AI 系统,能够使用语音模式以及可穿戴设备、智能手机中的生理、声学和语言数据,来检测夫妻之间的冲突。测试者需要佩戴追踪诸如心率、排汗、体温、嗓音、和语言强度等变量的检测器。研究人员通过收集并且分析比如音调和频率等声学特征,以及如动词和代词的数量等语言特征,来预测伴侣之间的关系状态是否有所变化或者恶化。
通过AI技术的辅助,可以识别追踪心率、音调、语言的变化,及时预测并且提供干预,比如,因为争议身体已经有了明显的变化的一方,特征会被AI捕捉到,在手机上可能会收到提示短信,告诉他/她冲突迫在眉睫,应该暂停对话并花 10 分钟进行冥想等。
因为AI技术的中立性,所以劝架的话,也会比伴侣一方的提示有用得多。想想看,发生冲突的时候,伴侣告诉你要冷静,这不是欠的慌吗?非常容易引起对方的反感以及防御性的反应,但是如果是中立的第三方提示、劝解,效果会好得多。
尽管该系统目前还未大范围推广使用,但是也提供了很好的探索方向。对于关系这种比较高级的情感检测领域,使用AI来检测伴侣之间的冲突,提供反馈和干预, AI能够做的事情大体也止步于此。至于冲突到底要不要发生,决定权还是在夫妻双方的手中。
技术衡量的是现成的相处模式,至于有问题的模式,比如,习惯表达否定和轻蔑的言论,习惯批评等,不改变这样的交流方式,长久以往,关系的温度就会降至冰点,利用什么样的AI技术都没有办法挽救关系。AI技术在关系中的地位是辅助方,关系中的双方是关键,技术在关系中亮出红灯,需要的是认识问题做出改变,这也是AI技术在关系中的意义所在。
冲突的处理也是处好关系非常重要的环节,但是也有处理不好散场了的结局,在关系中,为什么有些人守护住了爱情?有些人磕磕绊绊伤痕累累呢?经营好的关系、婚姻还有什么别的秘诀呢?
三、AI担任婚姻分析师
爱情也好,婚姻也罢,相处的开始都是充满了激情、喜悦,契合的灵魂终于相遇了,每一天都甜蜜蜜,相识得久了,有些人的关系归于平淡,虽有磕绊,但也能够和谐相处;有些人在摩擦中耗尽了爱意,走着走着就散了,什么海誓山盟的都见鬼了。好的关系、好的婚姻样貌,情感专家给了我们很多答案。
首先好的伴侣是关键,拥有一个人品良好,善良正直,负责顾家,情绪稳定的人很重要;其次是价值观念的合拍、价值观念相似的话,生活的决策,判断比较一致,摩擦较少;再者就是相处模式的融洽,会积极创造美好的体验,解决摩擦、问题,而不是制造冲突,会尊重支持对方。
此外,基础的物质保障得有,不求大富大贵,贫贱夫妻百事哀的老经验不是没有道理的,贫穷能够限制的东西太多了,而限制就会让人眼界、思维狭隘,冲突不断。
虽然我们知道了好的婚姻、好的感情的标准,但在生活中,还是免不了情感的变质。有种道理都懂,但是还是过不好的无力感。看似简单却又摸不着头脑的关系,让人又爱又恨。
有一项AI的研究,倒提供了一种新的思路。
AI通过分析超过1万对夫妻的数据,找出婚姻经营良好的关键,认为一段关系能维持下去的原因是关系本身的价值,什么意思呢?一段关系的好坏,关乎的是夫妻双方对关系本身创造的生命力。
研究表示人对一段关系的满意度45%,这是由这段关系本身的特性决定,而自身的性格在决定因素中占到21%,伴侣的性格只占到5%左右,关系本身的特性比个人特性起到的作用更重要。
这个结论跟我们强调伴侣作用的观念不太一样,理想伴侣在一段良好的恋爱关系中起到的作用并没有想象中大,最重要的还是这段关系本身。两个人在关系的蓄水池中,创造的价值越多,比如共同难忘的经历,彼此才懂的笑话,比关系中的个体性格什么的更重要。
AI关于好婚姻的关键论点很有意思,在生活中似乎也能找到佐证。有些鸡飞狗跳的婚姻生活,看着很累,但当事人吧,冲突外跟没事人似的,两个人就是舍不得散掉,似乎就是关系本身的价值比双方毛躁性格的冲突权重更大。
散不掉的爱情、婚姻归根结底都是爱还存在。要么就是今天你爱我多一些,要么就是明天我包容你多一点,你来我往的正向循环,连接的情感比较深厚。
诗人奥登有首诗,很能表达出这种感觉,叫《爱得更多的那人》:
当星辰以一种我们无以回报的激情燃烧着,
我们怎能心安理得?
倘若爱不可能有对等,
愿我是爱得更多的那人。
好的感情里面,双方都是爱得更多的那个人。
AI在情感关系中牵线搭桥,处理冲突,改善关系,甚至是分析情感提出新的论点,扮演的角色无论是靠谱的媒婆、婚姻治疗师,还是情感专家,都做得有模有样。
不过AI在这些角色中只是作为工具的存在,并不能一劳永逸的解决所有的问题,关键的把控还是在人的层面。所以想当甩手掌柜,拜托还是清醒一点哈,好的伴侣还得靠人为主动,请各位好生努力努力再努力。
爱是人类永恒的追求,美好的感情还是很滋养人的,大家伙不要躺平放弃。
单身的人,也不必太给自己压力,毕竟世俗给的已经溢出来了,珍贵的人需要同等的珍贵相待,慢慢来有时候就是一种诚意。
有伴侣的人,祝福你遇到的都是如彩虹般绚烂的人,未来的漫长光阴有人相爱,与你立黄昏,深情共白头。
结婚的朋友,祝你朝暮不依长相思,白首不离长相守。
#合作媒体#
脑极体,微信公众号:脑极体。写让你脑洞大开且能看懂的人工智能、流媒体、海外科技。
题图来自Pexels,基于CC0协议返回搜狐,查看更多
责任编辑:
警告本回答将不可避免地包含以下内容:海量新鲜狗粮亿点点奇怪的专业术语(协同过滤、SVD矩阵分解、TF-IDF、词嵌入、距离与相似度)的解释和简单的数学公式关于人工智能、推荐系统与所谓“信息茧房”等妖魔化概念的思考。当然可以,我现在的女朋友 @知言 能找到我就多亏了知乎的“人工智能”~不可思议嘛你可能觉这个听起来很扯,但不妨先听一下我们的故事:“诶薰风你怎么这么快就脱单啦?”“薰风你天天蹲实验室从哪里认识的妹子?”“薰风你前段时间不是还跟我说不发论文不谈恋爱的吗喂?”前段时间,我的微信消息列表充斥着如上的问题。对这类问题,我一概用如下回答搪塞过去:“我也不知道,天上掉下来的……”但实际上,我知道我能有现在这么适合我这么可爱这么善良这么懂我的女朋友,全靠以互联网与人工智能算法代表的信息科技的进步。Part 1:狗粮故事——“天上掉下来的女朋友”实际上,让我们结缘的是下面我写的这个回答。我写这个回答的时候是万万没有想到这个沙雕段子都能让我找到女朋友的。而对我女朋友来说,这就是一个曲折的故事了(以下为她的第一视角): 那天在实习公司里,离下班前一小时的我正在享受着惯例的摸鱼时光。我一如往常打开知乎,刷着推送的信息流,其中有一个平平无奇的标题映入眼帘……我:不是吧阿sir真的有人能和导师谈笑风生吗?让我来看看傻吊网友又说了什么. jpg结果我看了大概十秒,开始精神恍惚:这个回答怎么感觉跟我写的弱智日常一样…我做梦的时候有了导师还写了知乎吗????一直到我把这篇回答读完,心里始终有种奇怪的感觉,好像是我认识了很久的人面对自己讲故事一样。好了,男人,你勾起了我的兴趣. jpg这时,我社恐的内心有一点点动摇了。理论上,我很想现在立刻认识这个人,但是我的手控制住了我自己...于是我从私信界面退了出去,在工位上干坐了一个小时……又到了愉快的下班时间,我混在一群憔悴的社畜中往地铁站走,常年社恐让我没有关注也没有收藏,但我还是鬼使神差从浏览记录里找出了这个怎么看都不应该印象很深的段子答案。我觉得,如果在这个时候把它关掉,我普通的日常一定不会有任何改变……但是,我一定会很后悔。即使不是现在,未来的某一天,如果不主动抓住这点渺茫的感觉的话,我会后悔的。结果,想了半天之后鼓起我一生一次勇气的成果就是……虚弱地在评论区夸了一句您真可爱…怎么搞的像在夸自己啊喂!!结果我这次还是没能发出去私信。但我没想到的是过了不到两分钟我被回复了,在???您也25h高强度冲浪???(薰风:实际上的确是凑巧……可能这就是所谓的缘分?)然后我吓得立刻关掉了知乎,不愧是我啊()但是心里还是有挺开心的,有一种顺着网线打到人的感觉!(薰风:?????)我就怀着这样的心情走进了地铁站,在等车的间隙冷静了一下,又开始想这件事。此时地铁站沉重的空气让我的思维发生了一些变化。简单来说就是:大脑:在,发个私信?手:不是吧阿sir为什么大脑:我叫你发就发(按住)于是,反应过来的时候我已经站在地铁里了,手里是一条没发出去的:我能求个好友位吗?所幸这次它终于在地铁门合上的前一秒被我按下了,成功的发送出去了之后,我们的故事就真的开始了……果然我的预感没错,这个人和我太像了,像到我好像可以直接猜到下一秒他要说什么,我那天还约了人,真就是一边吃饭一边忍不住笑的打字,幸好对面和我关系很好没有直接揍我。Ok,狗粮发够了,该写正文了(不是)那么,这段故事和“人工智能”有什么关系呢?这就要说经常被妖魔化的人工智能黑科技——推荐系统了!Part 2:互联网时代,人工智能如何联系我们彼此?1. 概述忽略亿点点细节的结缘示意图以摸鱼的女朋友如何刷到我的沙雕段子为例,让我们从头分析人工智能如何联系我们彼此。上图是对我们结缘流程的示意图,我们能够相遇全都仰仗知乎本身的推荐系统。推荐系统(Recommender system)[1]旨在通过用户过往的行为预测用户未来对某些未知内容的偏好,这是人工智能应用中一个很重要的子领域。不论是知乎微博的信息流,b站首页的视频推荐,还是最近被推上风口浪尖的抖音……它们让人一刷几小时的秘诀就在于自身成熟的推荐系统。当我们在为又浪费人生中宝贵的几小时而懊悔不已时,实际上侧面就反映出了推荐系统对我们喜好的成功把握。而推荐系统分为两大流派:大力出奇迹派:协同过滤千人千面派:基于内容的推荐(个性化推荐)事实上,这两大流派不是相互孤立的,配合食用可以得到更好的效果。2. 人多力量大——协同过滤协同过滤基于一个非常简单的思想,那就是臭味相投,换句话说就是和你口味差不多的人,他们喜欢的东西你也应该差不多。下面这个动图就是一个典型的协同过滤的示意图!在这里,有5个不愿意透露姓名的网友对四种内容分别做出了自己的评价(这里为了简化,只有四种内容且只有喜欢/讨厌两个选项)。当所有人都对大部分物体做出了自己的反馈时,系统就会通过已经记录好的表格(在数学上我们叫他“矩阵”)。现在,如果我们想知道第5个用户对视频(第三列)的喜好,就首找已知的评价寻找出与用户5有相似爱好的人(用户2和3)。最终用相似爱好的那些人,对视频的评价作为用户5的预测评价。以此类推,当这个表格中所有的空格都被我们用这种简单的方法填满,那么系统就可以向所有用户推荐他们“可能喜欢”的内容啦!有关协同过滤的一个简单例子但是,上面这是一个很理想化的情况。因为所有人都对大部分内容做出了评价,但这在现实世界是显然不合理的……(毕竟我们都不会每天25小时网上冲浪hhh)协同过滤算法绕不开的问题就在于其稀疏性,换人话说,就是相对于茫茫多待推荐的内容,真实用户的反馈肯定是很少的,反映在这个表格中就是只有极少的格子被打上了喜欢/讨厌的标签。再想想,这个世界上会有多少与我们喜好100%一致的人呢?在内容相对于人数很少而有大量反馈的情况时,我们也许可以通过对大量的事实中查表去看喜好一致的人对未知内容的反应。但事实上由于真实数据的稀疏性,我们必须想办法通过极少数的事实去反推大量未知的喜好。这才是协同过滤的难点所在。解决这个问题的很多,这里就介绍其中的一种。大力出奇迹——矩阵分解矩阵分解流派认为,既然我们已经把这个问题抽象成了把一个稀疏的矩阵(表格)填满的问题,那么为啥不直接从矩阵论(即进阶版的线性代数)中寻找一些数学工具呢?现在最受青睐的数学工具就是以奇异值分解(SVD)及其变体为代表的矩阵分解法[2]。PS: 事实情况中,已有的用户反馈可能不是一个二维的矩阵,而是很多二维的矩阵拼在一起(比如根据你朋友在微信里喜欢的视频主题,推送你在知乎的有关内容就涉及了微信和知乎的两个矩阵)。这种矩阵拼起来的三维结构我们叫做张量(Tensor),不过这里还是先介绍简单的矩阵分解。矩阵分解法的核心思路在于:现在假设这个所有用户的评分矩阵本来应该可以填的满满的(是一个满秩矩阵),而现在我们看到的矩阵实际上是“真实”的满秩矩阵的一部分。那么,我们可以寻找对“真实”矩阵的分解,让这个分解再次组合出来的结果,与已知的数据的差别足够小。额这么说太抽象了,那么我们直接上数学公式吧!(亿点点公式警告)现在,假设:R 为用户对所有内容的评分矩阵(对应上面动图的表格,表格中的喜欢对应矩阵中的1,不喜欢对应矩阵中的0)U表示用户数(上面动图中为5)I表示商品数(上面动图中为4)现在利用 R 中已知的那些评分,训练一组小矩阵 P 和 Q , 使得 P 和 Q 相乘的结果中与已知评分的那部分能很好地拟合。那么,拟合好的 PxQ 结果中剩下的的元素就是未知评分!也就是R_{U \times I}=P_{U \times K} Q_{K \times I} 接下来的问题是,我们应该如何计算 P 和 Q?聪明的小朋友就知道要用最小二乘法拟合啦!现在呢,假设已知的每项评分为 r_{u i} (第u个人对第i个内容的评分),而预测的评分为 \tilde{r}_{u i} 。由奇异值分解的定义,预测的评分可以由奇异值 P 和 Q 元素的相乘求和得到:\tilde{r}_{u i}=\sum_{k=1}^{K} p_{u k} q_{k i} 那么,对于所有已知的得分和预测的得分,我们就有了误差 e_{u i}=|r_{u i}-\tilde{r}_{u i}
最后,我们的目标就是让所有的误差的平方和加起来最小(所谓的最小二乘法):\min_{p,q} \quad S S E=\sum_{u, i} e_{u i}^{2}=\sum_{u, i}\left(r_{u i}-\sum_{k=1}^{K} p_{u k} q_{k i}\right)^{2} 求解上述最优化问题,我们就可以得出最优的拟合结果,求出最终补全的矩阵并给用户推荐啦~当然,如果只通过减小误差往往会陷入机器学习常见的过拟合问题,即人工智能模型过于关注已知的内容却忽略了未知结果的合理性。因此,现在的主流方法在最小化拟合误差的同时,还会引入所谓的隐语义矩阵的正则项。\begin{array}{l} S S E=\frac{1}{2} \sum_{u, i} e_{u i}^{2}+\frac{1}{2} \lambda \sum|p|^{2} \\ =\frac{1}{2} \sum_{u, i} e_{u i}^{2}+\frac{1}{2} \lambda \sum_{u} \sum_{k=0}^{K} p_{u k}^{2}+\frac{1}{2} \lambda \sum_{i} \sum_{k=0}^{K} q_{k i}^{2} \end{array} 好了,以上就是最基础的基于矩阵分解的协同过滤,是不是很简单呢?最后,我们回到我和女朋友结缘的例子:那段时间她在狂刷和研究生有关的内容知乎中其他对研究生内容感兴趣的人(特别是对她看过的内容)点赞了我的回答于是推荐系统基于协同过滤的原则推荐了我的沙雕段子。怎么样,是不是瞬间就合理了起来,我们这些搞科研的就是喜欢把三句话就能讲完的东西强行写三十行还带一堆乱七八糟的公式!(理直气壮而因为这是最基础的方法,所以后续还有很多改进的地方。最有意思也最合理的改进就是,除了单纯考虑用户对内容的反馈,内容和内容,以及用户与用户之间的联系本身也是值得注意的。那么,这些联系如何求得呢?其实这就是基于内容的个性化推荐啦~3. 千人千面——基于内容的个性化推荐Personas are a concrete representation of target users.(用户画像是目标用户的具体表示)——Alan Cooper(现代交互设计之父)首先,在与平台互动时,我们就早已被人工智能算法抽象成了一组数据,这组数据学名叫做"用户画像(Persona 也是女神异闻录的英文名)"。它可以通过我们在互联网上的种种行为抽象出属于我们自己的一组数字。在过去,这组画像主要是我们的年龄,我们的消费水平,购买过的物品,等等一系列我们视作隐私的东西。我至今认为这些是我们需要捍卫的不可随意染指的自留地。但是,现在随着自然语言处理(Natural Language Processing)技术的发展,代表我们的那组数字,逐渐从控制我们推送广告的那些粗糙的规则(比如给年轻的女性推送综艺节目广告,即使她可能并不感兴趣),转向了我们真正感兴趣的内容本身。那么,如果我们可以将每个人的喜好和每个内容,都通过某种方法抽象为空间中的一个向量(不好意思我又不说人话了),就像有一张地图,系统在知道每个人所处位置的同时,还知道每个内容(有点像地图中的“景点”)的位置,它自然就会对每个人推荐离他们最近的内容。那么,我们从哪里才能找到这个地图呢,谁又能知道我们身处何方?如何划重点——关键词提取(TF-IDF)OK,我们先看看如何对我的沙雕段子进行定位。首先,我们写的内容虽然很难用一句话完整概括,但总结出几个关键词应该是没有大碍的。现实情况中也是,对全篇所有内容都进行定位和综合十分耗时耗力,但如果先将最代表本文的几个关键词抽取出来再进行定位那当然就事半功倍了~这个道理在另外一个大领域——搜索引擎中也是这样。关键词抽取就属于自然语言处理和信息检索的入门本领之一啦,最简单高效的方法就是“词频-逆文本频率(TF-IDF)”[3]法。其中,对于第 i 个文档Di,单词 w 的词频 TF 为该文章中单词 w 出现的次数(并处以文档Di的总长度)。T F_{w, D_{i}}=\frac{\operatorname{count}(w)}{\left|D_{i}\right|} 而逆文本频率 IDF 则反应某个单词本身的大众脸程度,即对于所有的N篇文章里,到底有多少个文章包含了单词 w 呢?I D F_{w}=\log \frac{N}{\sum_{i=1}^{N} I\left(w, D_{i}\right)+1} 上式中, I\left(w, D_{i}\right) 是一个常见的示性函数,即当文档 Di 中包含单词 w 时,该值为1,否则该值为0;对所有文档的示性函数求和,结果就是包含了这个单词的文档个数。而为了避免出现除以0的情况,这里的分母还加了个1。最后,将词频 TF 与逆文本频率 IDF 相乘,我就得到了最终的结果T F-I D F_{w, D_{i}}=T F_{w, D_{i}} * I D F_{w} 简单地说,这条简单的规则将本文中比较普遍存在的且在其他文章中较为稀有的单词作为关键词。现在,知乎就提取了我沙雕段子的关键词——“导师”。但是,我的关键词“导师”和女朋友搜索的“考研”是两个单词,虽然他们的含义十分相关。而基于简单的规则即使可以找到概括性很强的单词,却不足以计算出单词之间的联系。更不要提在地图上标记出我的沙雕段子和女朋友的浏览兴趣的位置了……让推荐系统能够从“考研”联想到“导师”,就相当于让它和人类一样真正理解文本的意思,从而产生联想。那么,人工智能如何理解我们的文本,又如何判断内容之间的匹配程度呢?让计算机看懂人话推送内容——词嵌入与相似性判断我们首先思考一个问题“计算机该如何存储我们的语言呢?”最直接的办法当然是列一个长串,给每个词一个独特的编号。但是缺点也很明显,我们无法从给定的编号反推词语的含义。因此,我们想要做到的是将所有单词的编号“嵌入”到一个能够象征单词语义的高维空间中。就仿佛在一张地图上,相似含义的词在相近的位置。这就是传说中的“词嵌入(Word-embedding)”。更宽泛的说,这也是语言模型的一个重要组成部分。最近AI界出圈的那个传说中可以生成一切的GPT-3实际上就是一种语言模型。那么,这种嵌入是怎么做的呢,其实也很简单。首先,我们有茫茫多的文本,我们只知道他们每个单词的编号却不知道意思。之后,我们将文本中的单词随机挖掉几个,让人工智能通过还能看到的单词,去猜被挖去的是哪个单词。在这个预测的过程中,他们就会发现一些单词的上下文非常类似,导致判断是这些单词之中的哪一个十分困难。这个时候,人工智能就会认为他们之间的语义是十分相似的。举个例子,下面有个相同长度(单词个数)的两个句子:“大家 都说 刘昊然 很 可爱”“大家 都说 薰风 很 可爱”现在,把“刘昊然”和“薰风”挖掉。人工智能发现上下文都是“大家 都说 (?) 很 可爱”。因为上下文完全一样,所以对人工智能来说,此时此刻 薰风=刘昊然。这就是人工智能的企业级理解。最终,在纷繁复杂的文本进行训练之后除了我=刘昊然这种不太靠谱的极端情况,大部分情况下人工智能都会得到所有单词之间的近似关系。而它最终的效果则是让被训练出的神经网络做到从毫无意义的编号映射到一个更加紧凑的一组数字中,他们放在空间里就是一组“向量”。相当于地图里的某个坐标。之后,问题就是这些坐标之间的“距离”或者“相似程度”如何判别了。回到我和女朋友结缘的这个例子上,假设我的沙雕段子,在词嵌入之后的向量是 x,而女朋友喜欢看的关键词向量是y。那么,他们的相似程度可以看作是空间中两个向量之间的夹角,即余弦相似度在空间中,两个向量间的余弦值可以通过使用欧几里得点积公式求出\mathbf{x} \cdot \mathbf{y}=\|\mathbf{x}\|\|\mathbf{y}\
\cos \theta 给定两个属性向量,x 和y ,其余弦相似性 θ 由点积和向量长度给出,如下所示:\text { similarity }=\cos (\theta)=\frac{x \cdot y}{\|A\|\|B\|}=\frac{\sum_{i=1}^{n} x_{i} \times y_{i}}{\sqrt{\sum_{i=1}^{n}\left(x_{i}\right)^{2} \times \sqrt{\sum_{i=1}^{n}\left(y_{i}\right)^{2}}}} 其中 x_i,y_i 是两个向量中各项的分量。大概是什么意思呢,就是说如果我的沙雕段子和女朋友的常看的关键词,在地图中属于“心往一处想,劲往一处使”,那么这个相似度的度量就会比较高。因此系统就会推荐。而还有一种可能性是,单纯从欧几里得距离出发:d(x, y):=\sqrt{\left(x_{1}-y_{1}\right)^{2}+\left(x_{2}-y_{2}\right)^{2}+\cdots+\left(x_{n}-y_{n}\right)^{2}}=\sqrt{\sum_{i=1}^{n}\left(x_{i}-y_{i}\right)^{2}} 若两个向量之间的距离比较小,系统就会自动推荐。最后,通过女朋友兴趣抽取出的画像中那一串向量,系统给她匹配了最相似的内容,就是我的沙雕段子。因此这段故事才得以开始。PS:我并不是知乎的算法工程师,且我的主要研究方向为教会人工智能看东西的计算机视觉。因此有关推荐系统与自然语言处理的知识可能不甚了解,我只能保证大概的正确性,不过看懂这些你对人工智能的理解应该就能打败90%的同龄人了(不是)。Part 3:什么才是最好的时代?我在去年有幸旁听了上海交大媒体与传播学院举办的一次学术研讨会,其主旨在于探究当今时代下我们所接触的信息与人工智能的关系。听之前,我其实也大概能猜到,总有几个词他们是绕不开的:“推荐系统,乌合之众,信息茧房……”。那些老师对于媒体与人文的理解自然在我这种理工男之上,我不该对他们多年的研究成果妄加评论。但一提到大数据人工智能,必然就是推荐系统让乌合之众住进了“信息茧房”,让我们失去了独立思考的能力而固步自封,认知退化。在他们眼里,或许这是传统媒体,甚至是传统媒体代表的新闻职业性和种种道德准则的沦丧,因此这是个最坏的时代。这种观点我听了很不舒服。我一直认为,科学技术的发展和人文社科的发展是相辅相成的,科技并不在人文的对立面。诚然,现在我们看到的情况是人们天天盯着手机而忽视了身边的亲朋,但这并不妨碍我和女朋友拜其所赐而相遇。我相信,在这个世界上还有千千万万的人,他们如天空的星星发出微弱的光,努力地照耀着自己,也梦想这有一天能照耀别人。但囿于那年的车马慢,这种梦想也只是梦想而已。但现在,互联网让远隔千里的人有了沟通的可能,而人工智能的发展让我们更容易地找到与自己志同道合的人。今天还是沙雕段子,明天可能就是某个天才的构想的诞生,某个救命药物的传递,是变革这个世界……而没有技术,这些也无从谈起。因此,就像我最喜欢的那个清华帅哥教授(实在不好意思,我忘了他叫啥了)说的,面对新技术带来的变革,与其恐惧、害怕、批判,不如勇敢地面对它。新技术是否能够对我们的生活带来好的影响,永远取决于使用它的人。而认识,了解了新技术之后,我们就能走在这个世界的最前端。对于愿意学习的人来说,现在就是最好的时代。最后,感谢缘分和算法让我遇到这么好的女朋友。特别鸣谢感谢老婆大人对本次回答素材的大力支持参考^https://en.wikipedia.org/wiki/Recommender_system^De Lathauwer, Lieven. Tensor decompositions and applications : a survey[J]. 2009.^Wu H C , Luk R W P , Wong K F , et al. Interpreting TF-IDF term weights as making relevance decisions[J]. ACM Transactions on Information Systems, 2008, 26(3):55-59.
“Even if you get home late and I'm already asleep...  就算你回家晚了 我已经睡了Just whisper in my ear one little thought you had today.
可还是可以在我耳边轻轻说你今天的 哪怕是是些琐碎的事情Because I love the way you look at the world.
因为我喜欢你看待世界的眼光”——《Her》《Her》网络剧照人类从未停止对人工智能另一半的向往。随着科技的发展,越来越多的影视作品、游戏等场景中,表现出人们对虚拟世界的狂热迷恋。《底特律变人》欲言又止的克洛伊-游戏截图未来:人工智能和人的界限从物理意义上来说,普通人类的思维,也是数据的传输交互,跟计算机的发展路径没有本质的区别。人最早创造人工智能,只是个程序,目的是为了替人类完成最底层枯燥的工作。而随着我们对工作复杂度的要求提升,对人工智能的自由度要求越来越高。由于机器天然的信息量和迭代速度优势,当他们的思维越来越接近人类,人类面对的是如何合理的处理他们的身份问题。我们再来看一下上帝造人的故事。上帝以自己为模板,创造了人类,然后进行观察。后来发现人类恶的一面,要以合理的方式处理掉对产生威胁的这些“复制品”,第七日创造了大洪水吞噬了世界。而留了一个内存备份——诺亚方舟,在整体格式化前,保存了一些觉得还算有价值的数据。然后再在这些数据基础上迭代2.0版本。在未来,人类和人工智能应该会达到一种平衡状态,因为双方并没有互相严重威胁的基础。AI未来的思维维度理论上会是在人类之上,而人类也不会成为AI的负担,反而会给AI带来多样性匹配视野。AI对人类来说会是生产力彻底解放的基础。很多人也许会因为AI的出现失去工作,但是AI提供的生产力资源将远远超出现有的规模,既大部分普通人根本不需要工作即可获得远超当前所拥有的社会物资。未来,少部分人会集中精力去做跟生产力无关的创造性工作内容。未来的“她”会成为你真正的另一半爱是什么?爱,是指人类主动给予的或期待的满足感和幸福感。这里是人类的定义,所以加了人类定语,但爱并不专属于人类。现代人的快速生活节奏,对爱的精神需求越来越高,而普通伴侣越来越难以满足对方的需求。这就会生成一个人类社会发展的传统矛盾,人们日益增长的物质文化需要同落后的社会生产之间的矛盾,噢错了,是日益增长的精神需求和现代人有限的时间和精力的矛盾。人工智能伴侣的优势:1、无限的时间,每时每刻的关怀AI,没有生物体人类的负担,也不需要考虑将精力分散给其他类似工作,社交,家庭等方面。可以全部精力放在你一个人身上,而又召之即来挥之既去。2、全方位的了解没有人比你更了解自己,如果有,那就只有人工智能。只要你需要,她可以拥有你的一切信息,包括你穿错了袜子,晚上忘记刷牙,对工作的抱怨,对生活的无奈。绝对的了解是极致关怀的信息基础。3、情商高维度的碾压人工智能用最基础的心理类大数据支持,就可以做到超越顶级心理医生的信息量。她们可以通过机器学习掌握心理疏导的互动技巧,能根据你的情况,给与最专业的沟通呵护。这点从维度上就会远远高于普通人类。《西部世界》网络剧照4、无同类社交负担心理医生的基本职业操守就是不会泄露病人的隐私。常规人类是很重视自己的隐私,即使再豁达的人,屎尿屁之类的一些事儿,也不会毫无顾忌的跟自己的另一半分享。有些特殊领域的内容,还会考虑到分享跟亲密的人会不会再增加他们的心理负担,所以宁可自己消化,或者跟小猫小狗倾述,也不愿对其他人说,因为我们都是人类。而跟人工智能的沟通,这些障碍就小的多,因为他们对你来说可能是那个可以倾述秘密的树洞那样,从技术上而不是道德约束上的的不可泄秘,以及更不会需要考虑给人工智能增加心理负担的担忧。5、低成本一个真实的伴侣,需要对相互的付出,不需要再赘述了,成年人都明白。而人工智能,未来需要你支付的成本,也许高不过QQ会员。综上所述,未来的人工智能,不管是不是会真正“觉醒”,其基础的大数据和机器学习能力,就足以碾压现有的伴侣。并且只有人工智能才有可能真正成为你生命中的另一半,灵魂上契合的另一半。想与“她”谈一场恋爱,已经不是梦想,而是随时都会出现。让我们一起期待一下未来的“她”“I'm so happy I get to be next to you and look at the world through your eyes.真高兴我能在你身边 透过你的目光一起观察这个世界”——《Her》-----------------我是分割线这里推荐一个非商业化的小程序,有兴趣的可以体验一下。主要功能是可以用机器学习的方法,生成二次元头像,每个头像都是独一无二的。使用的技术是GAN——生成对抗网络GAN原理样图目前朋友还在进行测试,小程序名称:人工智能女孩有兴趣参加测试的可以加企鹅群 794049236
讨论

我要回帖

更多关于 人工智能技术是什么 的文章

 

随机推荐