有没有专业做语音识别技术的优点的企业？

AutoCAD | 朝鲜战争（1950-1953） | 炒股 | 扫地机器人 | 室内设计 | 美国留学 | 丹东市 | 方言 | matlab | 摩纳哥 | PHP | 机器学习 | 山阳县 | centos | 新西兰 | 细胞生物学 | 少数民族 | 工业机器人 | 直升机 | 大学专业 | 东海县 | 张宏伟 | 智利 | 视频会议 | 种植 | 在线教育 | 保险业 | 化学实验 | 首次公开募股（IPO） | C4D | 黄金投资 | 铅山县 | 女性主义 | 文案 | 莎车县 | 东京 | 电厂 | 情商 | iPad | 郭嘉 | 桌面游戏 | 按键精灵 | OneNote | 给排水 | 骑马与砍杀 | 媒体 | 阳信县 | 金融数学 | 小店区 | 航母 | 高中物理 | 插件 | 广告文案 | HTML | 植保无人机 | 外汇投资 | 德邦物流 | 创业团队 | 爬虫（计算机网络） | Spss数据分析 | 电脑硬件 | CSS | 易纲 | 房屋 | 电学 | 遗传学 | 航拍 | pdf | 白兰地 | 互联网创业 | 运载火箭 | 秦岭 | 徐州市 | 绿茶 | 风水堪舆学 | 整容 | Adobe After Effects | 3D Max | 传媒 | 文化差异 | CAD制图 | 民间借贷 | 计算机专业 | 老挝 | 江苏银行 | 韭菜 | 背景音乐（bgm） | 网盘 | 马克思主义 | 私募证券投资基金 | 亲子鉴定 | 外汇 | 虚拟机 | 摄影技巧 | 初中数学 | PMP | Microsoft SQL Server | 五行 | 央视 | 信托 | 公司法 | 软件开发 | 赎回 | 用户界面设计 | 退伍 | 美容整形 | 长城 | 3D打印机 | 塞浦路斯 | 景观设计 | 充电器 | 函数 | 分子生物学 | 名言 | 活动策划 | C#编程 | SEO | 创意 | 王兴 | Apple WATCH | 搜索引擎优化（seo） | 因果 | 宁晋县 | 火灾 | 动物保护 | 董卓 | 文身 | 产品 | 物联网 | 咖啡馆 | 幼儿园教师 | 电气工程及其自动化专业 | 人生规划 | 鱿鱼 | 基金定投 | Apple ID | 日本文化 | 后宫·甄嬛传（书籍） | 火影忍者 | 图形处理器（GPU） | 投资银行 | 建筑设计 | 大脑 | 生命 | 购机咨询 | 传统文化 | 希腊 | 3D | 组装机 | 摄影师 | 企业邮箱 | 语言学 | Microsoft Visual Studio | unity（游戏引擎） | 祛痘 | 国家开发银行 | 大城市 | 中药 | 佛法 | 创业想法 | 淘宝美工 | 气候 | 电风扇 | 黑洞 | .Net开发 | 广告人 | 嵌入式系统 | 图像处理 | 户外广告 | 益生菌 | 人性 | 理科 | 饮料 | 手工艺 | 几何学 | 港股 | 会计学习 | 进化 | 笔记本电脑 | 山地车 | 房地产开发商 | 电路设计 | 中国文化 | 五台山 | 快捷键 | 土地政策 | 汉服 | 显示器 | 茅台酒 | vmware虚拟机 | 重大疾病保险 | DJI大疆创新 | 核电站 | 养老 | 广州市 | Stm32 | 延安 | 嘉兴市 | 显卡 | 债券 |

你的位置：网站首页 >> 频道首页 >>健康 >>有没有专业做语音识别技术的优点的企业？

有没有专业做语音识别技术的优点的企业？

来源：蜘蛛抓取(WebSpider) 时间：2022-11-17 11:02 标签：语音识别技术的优点

在AI领域，相比创业公司，大公司具有天然的先发优势。在技术方面，决定技术的三个要素——数据、算法模型、计算力，背后的潜台词对应的是数据量、人才、资金，大公司更占优。在产品应用方面，大公司本身就有大量的用户基数、畅通的推广渠道，也是大公司的强项。

事实上，现在已经很难说哪家大公司完全与AI不相关，毕竟只要有数据，就很难不用到机器学习的算法。不过，出于本身的战略规划及实际业务情况，大公司对于AI行业的重视程度肯定各不相同。

旷视主要做人脸识别相关的技术支持，除了在安防、金融领域，也在尝试拓展机器人相关业务。

10月的2016年安博会上，旷视推出了新的自研智能处理器MegBrain-M1001 ，基于 NVIDIA Jetson TX1 平台开发，运行 Face++ 人脸识别算法，可以嵌入于旷视全线智能产品和服务中。

1、旷视与神州云海达成合作

旷视科技也在切入机器人领域，为机器人厂商提供视觉组件，增加人脸识别、证件比对等功能，提升机器人的智能化程度。不久之前还与国内机器人本体厂商神州云海达成合作，将视觉模块植入到了银行服务机器人中，提供客户识别、业务引导、自动巡视等功能。

1、旷视获得富士康等投资人新一轮融资

9月底，中国台湾鸿海集团发布公告，通过旗下子公司FOXTEQ HOLDINGS，投资旷视2000万美元融资，获得3.286%的股权。36氪向旷视求证，除了鸿海集团，这一轮还有其他投资人参与投资，目前正在走流程的过程中。

1、商汤科技研发从核心技术到上层应用的手机人像拍照解决方案。

根据商汤科技官方提供给36氪的信息，目前公司在针对手机拍照中的人像场景，研发从核心技术到上层应用的人像拍照解决方案。底层技术包括：人脸检测技术、人脸追踪技术、人脸关键点技术、人脸属性识别技术、人像分割技术；上层应用包括：人脸艺术画应用、人脸哈哈镜应用、人像美颜应用、人像背景虚化应用等。基于商汤科技的智能化深度学习引擎，可以解决暗光、逆光、大角度的人像对焦问题，同时美颜应用、背景虚化应用的实际效果稳定，并可以根据人像属性、环境场景有针对性的优化。

此外，商汤科技也在为手机双摄提供匹配多种模组的软件算法，包括：背景虚化、先拍照后对焦、暗光拍照、光学变焦、虚拟现实3D相册。这些功能点可以在双RGB相机、RGB-Mono相机以及光学变焦相机中应用。

目前已与OPPO、华为、小米、vivo、奇酷360等国内众多知名厂商合作，提供手机行业解决方案。

1、商汤科技与NVIDIA达成合作

根据商汤科技官方提供给36氪的信息，商汤科技已经与NVIDIA达成合作，基于商汤科技利用机器视觉、深度学习技术平台和视觉大数据，作为NVIDIA的平台级合作伙伴，为智慧城市提供解决方案。

在安防领域，商汤科技SenseFace2.0 人脸布控实战平台已在北京、广东、海南、重庆、四川等多地应用，并在刚结束的2016高交会中，为近60万人流量的高交会报价护航，助力反扒行动，提供实时嫌疑人预警。

2、商汤科技将于明年1月份参加美国CES大会

今年6月，依图获得来自云峰基金的B轮融资，此后的一个业务重点就是杭州城市大脑项目。

1、依图科技参与杭州城市大脑项目

阿里近期正在和12家公司合作，为杭州打造“城市数据大脑”，对全城视频进行实时分析。依图科技也是12家合作伙伴之一。

出门问问主要提供智能语音相关的技术及服务，一直想沿着AI内核，扩展产品线，提升自己的盈利能力。

1、前微软Cortana首席NLP科学家黄美玉博士加入出门问问

今年年中，前微软Cortana首席NLP科学家黄美玉博士已从微软离职，加入出门问问，主要负责语音识别以及NLP（自然语言处理）算法等方面的工作，入职之后一直在美国带团队，对出门问问的中文和英文智能语音交互技术从最底层开始进行优化升级。

1、发布智能后视镜问问魔镜

11月22日，出门问问将召开发布会，这次发布会上回发布一款智能后视镜产品问问魔镜。这意味着出门问问的AI产品化从可穿戴场景到了车载的场景。

2、升级智能手表 Ticwatch 2 ，增加银联刷卡功能

11月22日，出门问问将召开发布会，会对智能手表 Ticwatch 2进行升级，内置NFC芯片，增加银联刷卡功能，此前Ticwatch 2 已经支持支付宝付款。

云知声主要提供语音识别相关的技术，应用方向主要是在智能车载、物联网等领域。今年7月，进了技术引擎升级，主打“语用计算”概念。

1、云知声语义云平台5.0升级

9月云知声语义服务云平台NLU5.0版本升级上线，引入了三语用计算、聊天增强和问答增强三个特性。这一系统也被应用在车载领域，推出了搭载云知声全新AI技术的智慧云镜“小凯”正式发布。

1、云知声与金山云达成合作

10月金山云和云知声达成合作，双方将在人工智能、深度学习、智能语音、公有云等领域深度技术合作。金山云将协助云知声实现人工智能基础服务的快速迭代、持续交付、效率提升。

2、云知声与平安好医生达成合作，切入移动医疗领域

11月，云知声与平安集团旗下平安好医生正式达成合作，将医疗智能语音录入系统应用到O2O健康医疗服务平台中。

1、推出抗噪处理的VDCNN算法模型结构

根据思必驰向36氪提供的信息，他们和上海交大联合实验室，对基于噪声条件下的语音识别问题进行了一年多的研究，提出VDCNN算法模型结构。相对于传统语音模型仅使用1至2层卷积层，思必驰通过堆叠较小的卷积层和池化层，将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述，能够更好地在语音模型的内部实现声学自动降噪的能力。思必驰表示，在噪声环境下语音识别，采用VDCNN算法，可以取得7.09%的词容错率，目前世界其他机构目前10%左右。

大词汇连续语音识别由于词汇量庞大且没有固定语法，会造成搜索空间非常庞大。目前，通过很多传统做法可以加快语音识别速度，如离线基于WFST的搜索空间预优化，在线逐帧同步维特比解码，结合可变帧率分析等方法。但是，离线优化效果有限，逐帧搜索计算量大，而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

近来，连接时序模型（CTC）取代传统隐马尔科夫模型（HMM），被应用到语音识别中，其特点显著，能够针对识别序列进行整体建模，带来更好的前后文建模能力，使语音识别的建模单元显著减少，并使庞大搜索空间相应减小。另一方面，模型本身建模了多帧对一个音素的映射关系，使得模型输出的声学信息集中。根据模型输出特点，适宜采用更长的搜索步长，由逐帧同步解码，转变为音素同步解码，从而减少了搜索计算量。

思必驰表示，结合以上两点改进，使语音识别系统的速度累积提高20-30倍，内存下降50%以上，从而使得大词汇连续语音识别可以应用于离线手持设备；而基于该系统提出的置信度算法，取得近一倍的提升。

1、思必驰升级车载系统，新增one-shot功能

思必驰于2016年10月20日升级版的AIOS 3.1，新增one-shot功能，实现唤醒词与语音操控之间无缝对接。AIOS For Car是思必驰于2015年10月针对智能车载后装市场推出的一款对话操作系统，主要应用在车机、智能后视镜、HUD，以及互联网汽车等产品上。AIOS 3.1中的功能包括：导航中的快捷交互、跨领域打断、合成音切换、音乐中的快捷交互、微信及微信地图接入、自定义唤醒词、路况及限行查询等。

2、思必驰试点推下AIOS For Home，与小米合作发布音响

11月22日，小米发布了小米互联网音响，售价399元人民币，该设备搭载了思必驰的AIOS For Home。

1、2016年9月思必驰完成新一轮融资

2016年9月思必驰完成新一轮融资，但暂未投资资方及投资金额。

优必选从人形机器人起家，但是近期也在更多的切入AI领域。

1、优必选与清华大学智能服务机器人成立联合实验室

优必选与清华大学智能服务机器人成立联合实验室。预计将在12月正式发布这方面的消息。

2、优必选教育联合华侨城中学共建机器人实验室

11月，深圳市华侨城中学与优必选教育(深圳)有限公司合作，优必选将从教学的硬件、技术、教学产品、课程、师资、教材教具等方面提供专业的全面支持，打造STEAM教育。

3、优必选获“2017CES 创新奖”

4、优必选Alpha2参与神州11号首次脑机交互实验

优必选Alpha2参与神州11号首次脑机交互实验, 操作员及宇航员将不需要进行任何实际操作就可以通过意念控制Alpha2机器人说话或者做动作。

今年世界互联网大会上，百度在乌镇设置了一座无人驾驶体验站，这座体验站的车程全长为3.16Km。该体验站长8米，宽2.8米，最高点3米，占地22.4平方米，世界互联网大会开幕当天，百度共投放了18辆无人驾驶车供乘客试乘。百度表示，此次乌镇无人车测试和试运营，是国内首次在全开放城市道路上行驶，体验全程3.16公里，将会经过三个红绿灯以及一次调头，途中可能会面临到人车混行、电瓶车穿行等多种路况。运行过程中，无人车使用的L4级自动驾驶技术能够实现红绿灯识别、行人避让以及超车并线等。

2、百度推出百度夜莺智能客服

11月，百度推出百度夜莺智能客服，该系统是百度基于人工智能、大数据、云计算等技术为企业提供AI+人工的客户服务解决方案，涵盖售前、售中、售后等各个环节。据说，已成功服务于众多产品线，可以解决80%的高频重复性问题。

10月，百度推出百度医疗大脑，将通过大量医疗数据、专业文献的采集与分析，模拟医生问诊流程，与用户多轮交流，依据用户的症状，提出可能出现的问题，给出最终建议，辅助基层医生完成问诊。

1、百度创建独立风投公司，聚焦人工智能领域

9月，百度创建独立风投公司，李彦宏亲自出任董事长，专注于人工智能，以及AR、VR等下一代科技早期创新项目，第一期基金规模将达2亿美金。

阿里人工智能这个词很少见诸媒体，主要是因为阿里的AI属于阿里DT体系，围绕电商、云计算、大数据、物联网等领域展开并应用。今年的云栖大会上，也提到了在城市大脑、智能交通、智能物流、工业4.0、新渔场、数字记忆等领域的布局。

1、阿里联合12家公司，打造杭州“城市数据大脑”

阿里近期正在和12家公司合作，为杭州打造“城市数据大脑”，对全城视频进行实时分析。

2、阿里双11晚会，ET大变魔术

ET是阿里人工智能的核心引擎。据雷锋网消息，今年的双11晚会上，ET在现场变了一个魔术：ET先是扫描现场5名观众的面部。然后，主持人让观众依次随机切牌，拿到黑色牌的观众转身面向后方。其中有4名观众转身后，ET再次进行扫描。最后ET 得出每位观众手拿的牌。当时在现场，ET展示了模仿马云说话的技能。

相比于百度、阿里，腾讯在AI领域的布局并不明显，主要还是围绕业务层面展开的。与腾讯的组织架构、管理风格有关，腾讯的AI主要是在不同业务体系之间展开的，公司层面主要是进行一些资本方面的操作。

1、腾讯成立人工智能研究院

此前传言的腾讯人工智能研究院已经正是成立。10月底，腾讯副总裁姚星在TEDx上演讲，提到了他所领导的腾讯AI Lab的现状和规划。根据雷锋网的整理，腾讯AI的使命是立志于要打造一个通用AI，而不仅仅是工具，腾讯也在做人脸识别、语音识别、聊天机器人等。AI Lab刚成立不久，处于非常初级的阶段，主要有两件事情：第一，招聘更多优秀的科学家能到我们AI Lab；第二，我们更多地想建立基础学科，做底层的研究，不急于做成产品。

此外，据说前百度研究院副院长也加入了腾讯人工智能研究院。

1、讯飞输入法用户数突破4亿

11月，科大讯飞宣布，讯飞输入法用户数突破4亿，活跃用户达1.1亿。

1、科大讯飞与甘肃省教育厅合作

11月，科大讯飞与甘肃省教育厅达成合作。根据相关报道，合作主要包含以下几个方面：一、为甘肃省中学建立基于大数据的发展性评估及教与学分析体系；二、助力全省课程改革；三、推动智能语音技术运用，营造课堂标准语言教学环境，实现数字资源规模化应用；四、为全省教育信息化公共服务的普及与常态化应用提供支撑；五、积极探索政企合作新模式，实现教育信息化的可持续发展；六、深化应用培训，助力全省教师信息化应用水平提升。

1、科大讯飞4.96亿收购乐知行

9月，科大讯飞公告称，拟通过发行股份及支付现金方式，以4.96亿收购乐知行100%股权；同时还将向特定对象以27.26元/股发行1100万股，募集3亿元配套资金。被收购的乐知行是一家教育信息化综合解决方案及服务提供商。

2、科大讯飞投资机器人系统公司ROOBO

9月，根据36氪独家的消息，ROOBO北京智能管家科技有限公司已经获得由科大讯飞领投，两家基金跟投的1亿美元A轮融资。ROOBO作为一家人工智能和机器人系统公司，在官网宣称自己是一家全球化的智能硬件孵化和发行公司，并且可以看到除了有售卖机器人之外，还有VR、无人机等设备展示。

3、科大讯飞投资小y游戏厅

根据36氪消息，做智能电视机上游戏分发的小 y 游戏厅告诉36氪，他们已经完成了1000万美元的 A 轮融资，领投方为科大讯飞。

4、科大讯飞拟500万美元参投美国丹华基金

根据科大讯飞的公告，为参与美国高科技领域的投资，科大讯飞拟参与投资丹华基金，科大讯飞作为有限合伙人，以自有资金认缴基金份额 500 万美元。丹华基金存续期限为8+2 年,其中投资期5年，退出期3年，8年到期后可经各方协商延期2年，投资方向主要为云计算、大数据、企业级应用、移动互联网、机器人、人工智能、虚拟现实、增强现实、金融技术、精准医疗、医学健康等。

1、科大讯飞将举行2016科大讯飞年度发布会

根据科大讯飞的公告，公司拟于2016年11月23日下午在北京国家会议中心举行“人工智能+ 共创新世界——2016科大讯飞年度发布会”。届时，将发布“讯飞超脑”在感知智能和认知智能的进展，及在物联网、教育、医疗、金融、机器人等重点行业的重点应用产品和解决方案。

2016年9月底，Google、Facebook、亚马逊、IBM、微软联合成立了一个名为“AI 伙伴关系”（Partnership on AI ）的非盈利性组织，旨在研究、推动AI领域的进展。事实上，这也是对AI最为重视的五家海外大公司，做过去三个月也有颇多动向。

过去三个月（9月-11月），Google不论是在技术层面、产品层面，还是资本层面、人才层面，都有不少新动向。

1、Google发布NMT 翻译模型，只用一个模型实现多语言之间的翻译

2、Google发布超分辨率图像处理技术 RAISR ，可使低分辨率图片瞬变高清，速度提升数十倍

根据Google官方消息，Google近日发布了超分辨率图像处理技术 RAISR，可使低分辨率图片瞬变高清，同时处理速度提升大约十至一百倍。（具体研究编译可点击链接查看）

3、利用深度神经网络，Google教会机器自学加密

根据Aixiv的论文，近期Google展示了一项新的技术，利用深度神经网络，让机器自己学会信息加密。经过1.5万次的尝试，机器终于加密成功，加密之后的内容成为了一句正常的话语，而负责“窃听”的机器人则未能破解密码。

4、Google发布大型视频数据集 YouTube-8M，开放50 万小时长度的标注视频

根据Google官方消息，Google最新版本的机器学习系统，可以理解图像的内容，并配上文字，准确率已经叨叨93.9% 。目前，已经在TensorFlow 上开源了这项成果。

其实，Google在技术层面的进展有不少是通过DeepMind来推动的。

1、DeepMind 发布《非监督辅助任务中的强化学习》论文，代理学习速度大幅提高

游戏《迷宫》中取得了突破，其中在《迷宫》游戏中，这个代理平均达到人类水的九倍。而未来，DeepMind则希望用这一方法，无需人工，让机器学习解决任何难题。

2、DeepMind联合牛津大学、加拿大高等研究院，发布 LipNet，利用深度学习读懂你的唇语

根据The Verge消息，DeepMind 与牛津大学、加拿大高等研究院合作，发布了利用深度学习技术读懂唇语的技术LipNet。使用 GRID 语料库，LipNet 的准确率达到了 93.4% ，而在此前的最佳准确率只有79.6%。

3、DeepMind推出单次学习，只训练一次数据就能识别出物体

DeepMind近期发布了一种新的被称为“单次学习”的算法，只训练一次数据就能识别出物体。具体来说，在深度学习系统中增加了一个记忆组件（包含事先训练的一个包含数百种图片的学习模型），此后分析图片中的特殊元素来完成识别。

根据DeepMind CEO Demis Hassabis 的Twitter消息，全新版 AlphaGo 将在 2017 年复出。有业内人士猜测，很可能会与柯洁对战。这一年，AlphaGo 很可能已经进行大量自我对弈，技能获得大幅提升。

5、DeepMind发布最新原始音频波形深度生成模型WaveNet，语音生成将更加自然

9月初，DeepMind公布了语音合成领域的最新成果——WaveNet，这是一种基于卷积神经网络的原始音频波形深度生成模型，能够模仿人类的声音，生成的原始音频质量优于目前Google最好的文本-语音系统，生成的语音与真实的人类声音的差异可以降低50%以上。

不同于不少公司重点主攻技术，Google的技术很多已经与产品相结合。

根据9to5Google消息，Google在11月中旬推出了一款涂鸦绘画应用 Quick, Draw!，系统会随机显示一个名词，要求用户在20秒内画出来，然后Quick, Draw! 会判断你画的到底像不像。这个应用使用了神经网络算法对涂鸦进行判断。此外，据说Google也在用它来研究如何让机器自学图像识别和光学字符辨识。

2、Google发布 PhotoScan 应用，CV技术加身，帮助手机轻松扫描照片

根据Google官方消息，Google11月发布了手机应用Google PhotoScan，利用手机摄像头，帮助用户轻松扫描照片，可实现类似家用扫描仪的效果。一直以来，因为手机摄像头的性能不足，扫描效果比较一般，Google采用了机器学习的方法，提升了扫描效果。

3、Google更新 Play Music，用深度学习挑选出最应景的背景音乐

根据Google官方消息，Google更新了 Google Play Music，会根据天气状况和地理定位给用户推荐歌曲列表。这其中主要应用了深度学习的技术，对使用者身处的环境和正进行的活动进行测算。

4、利用 TenseFlow，研究人员在4.5万张照片中找到了一只濒危海牛

根据Google官方消息，昆士兰大学（Murdoch University）的研究人员利用无人机及Google的 TensorFlow 技术，找到了一只濒危海牛。研究人员利用无人机航拍了大量的海洋照片，利用 TensorFlow 帮助计算机快速学习，从中找出了海牛。这一技术未来还很可能被运用在其他海洋生物研究领域。

根据国外消息，Google 利用 AI技术引导热气球运动，为 Project Loon 项目提供支持。具体来说，系统会根据热气球的高度、位置、风速等因素作出预定的反应。

根据BI消息，Google近期推出了一款基于AID网络言论监控工具Conversation AI，通过机器学习技术，自动抓取网络上的各种脏话，并对其危害性打分。这个工具已经在《纽约时报》、维基百科进行使用，准确率在92%左右，未来有可能开源。

9月Google在官方博客宣布，已经收购了为开发者提供Siri式会话机器人开发工具的API.AI背后的团队，但并未透露具体交易细节。成立于2010年的API.AI是2014年推出这个工具集的，迄今为止公司总共进行了4轮融资，融资总额为860万美元。

API.AI作为聊天机器人开发框架，提供了诸如语音识别、意图识别、上下文管理等功能，并且允许开发者针对特定机器人的独特需求提供领域知识，从而让开发者可以定制、强化聊天机器人的智能。目前该框架支持15种语言，其中包括了英语、中文、法语、德语以及西班牙语等。API.AI的网站还有一个动态记录接受请求数的计数器，迄今为止，其处理的请求数已经超过了30亿次。有超过6万开发者在使用API.AI的工具集，用来开发Slack、Facebook

11月中旬，斯坦福大学人工智能实验室主任李飞飞、前 Snapchat 研究主管Li Jia（音译），加入Google，担任云机器学习部门负责人。Google方面表示，云机器学习部分将会致力于将尖端技术融入Google Cloud的各产品中。

今年9月底的微软Ignite大会上，微软也进一步公布了自己在AI方面的战略。对微软来说，大众化AI(democratize AI)是其最重要的方向之一。相比于Google，微软AI方面的进展更多的还是停留在技术研究、企业服务方面。

1、微软成立微软人工智能与研究事业部

今年9月底的微软Ignite大会上，微软正式成立微软人工智能与研究事业部(Microsoft AI and Research Group)，该事业部是由技术与研发部、人工智能研究部门合并而成，将由微软全球执行副总裁、技术与研发部门主管沈向洋领导。信息平台( Information Platform )、Cortana 与必应、环境计算( Ambient Computing )和机器人团队的高管也将加入这一部门。

1、微软发布全新微软知识图谱和概念标签模型

模型可应用在搜索引擎、自动问答系统、在线广告系统、推荐系统、聊天机器人等。

2、微软公布语音识别新进展，对话语音识别错误率降低至 5.9 %

微软最新的论文显示，经过微软工程师训练的神经网络（neural network）用于语音识别，错误率已经降低到了5.9%，而在此之前的一个月，错误率还在6.3%左右。

3、微软联合俄勒冈卫生科学大学，利用AI辅佐癌症治疗

近期，微软开发了一个机器学习项目Hanover，可以学习癌症相关的学术论文。目前已经与俄勒冈卫生科学大学Knight癌症研究合作，寻找能够有效治疗急性骨髓性白血病的药物，并未患者制定个性化的治疗方案。

1、微软小冰“客串”莫高窟讲解员

根据微软官方消息，9月底，微软小冰进驻敦煌研究院微信账号（微信号：icaves），借助敦煌研究院提供的珍贵数据，借助微软亚洲研究院的自主知识学习技术（Doc Chat），可以在短时内对海量的素材知识进行学习归纳，讲解莫高窟相关的知识。

2、微软推出微软小英，利用AI教英语

根据微软官方消息，近期，微软亚洲研究院和微软互联网工程院合作，根据中国用户的语言学习特点，推出了一款名为“微软小英”的英语口语练习应用。这款应用融合了语音识别、口语评测，自然语言处理、语音合成等人工智能技术，有情景模拟、情景对话、发音挑战、易混音练习四大模块，目前已通过微信服务号的形式上线。

近期，Facebook AI 研究院发布最新论文，展示了最新的机器视觉方案SharpMask。这一方案主要用于快速分割对象这类任务，相比DeepMask ，图像精确度平均提升了 10-20%，处理速度提升50%左右达到8 秒/图。

近期，Facebook 在官方博客上宣布了一种可以用在移动设备实现实时风格的深度学习系统 Caffe2Go，可以快速实现高质量的视频风格迁移，可以在手机上运行，目前已经可以实现毕加索风格的迁移，预计有望在几个月内开源。

当时是卡内基·梅隆大学的学生，公司专攻机器学习算法，使智能手机通过相机的辅助来完成实时分析面部。Facebook 表示，该公司将为照片和视频带来更多有趣的效果，其中包括 Snapchat 等社交应用中常见的效果、实时滤镜以及换脸工具。

IBM在人工智能领域布局已久。早在几年前就推出了Watson，近年来一直想将Waston的认知能力拓展到其他的领域。

1、IBM联合MIT，想要开发出像人一样表述所见所闻的 AI

根据IBM官方信息，IBM与MIT合作，组建“IBM-MIT 脑启发多媒体机器理解实验室”，目标是开发出模仿人类理解能力的认知计算系统。这个联合实验室将采用了无监督的机器学习对音视频流数据进行分析，并且按照大脑神经网络的组织对AI神经网络进行新的建模，通过多学科交叉来推进计算机的理解。而这种理解有很多的潜在应用，比如帮助老年人、残疾人改善生活，帮助组织维护和保养复杂机器等各种跨行业应用。

9月底，IBM推出了一项基于AI的大数据一站式分析服务平台Project DataWorks ，可以整合所有类型的数据，并利用AI进行分析处理，目前已经可以在 IBM 的云平台 Bluemix 上使用。

3、IBM发力医学影像领域，皮肤癌检测率提升到97%

近期，IBM Research与Memorial Sloan Kettering Cancer Center合作，推出医疗图像模型，评估出具体的皮肤癌级别，将皮肤癌检测率提升到97%。目前，IBM使用者一技术测试了3000例黑素瘤和其他皮肤病变症状。

1、IBM与Slack合作，开发更智能的数据分析聊天机器人

近期，IBM 与 Slack宣布合作，双方将基于 IBM Watson 开发聊天机器人，让 Slack 平台上的聊天机器人能够更好地理解用户的问题，同时还将推出支持 IBM Watson 人工智能技术的工具包，让开发者能够将此功能整合到 Slack 平台上。

在乌镇举办的世界互联网大会上，IBM发布了Watson 2016成果。根据搜狐科技的报道，在机器学习算法领域，IBM 获得一系列专利成果，使得Watson可以自动选择和优化机器学习算法和模型，整个过程无需人工介入，无需编程。在商业层面，目前Watson已在癌症领域出色地工作，向美国、中国、印度、泰国等国家和地区的2亿病人提供诊断和治疗；与西门子、GE、惠而浦等领先企业合作，在医疗、环保、能源、金融、制造、教育等 20 多个行业中都得到了商业应用；服务用户超过2亿人。

根据Fortune消息，从明年一月份，IBM所有身患癌症的美国区员工，都将可以利用Waston找到最有效的肿瘤药物和临床试验方法，以帮助他们早日恢复。

3、IBM联合NVIDIA，开发商用深度学习系统

IBM和NVIDIA合作，开发用于加速训练人工智能的系统IBM PowerAI，使用了IBM一款专门为人工智能生产的服务器，采用了NVIDIA的NVLink技术加速机器学习的速度。

4、IBM联合梯瓦，将利用Waston进行新药开发和慢性病管理

近期，IBM与全球知名的仿制药公司梯瓦（TEVA）合作，二者将联手利用IBM Waston系统来进行新药开发和慢性病管理。

据华尔街日报消息，近期IBM向金融咨询公司Promontory发起收购邀约，收购完成之后，IBM将组建新的沃森金融服务子公司，利用Promontory在金融领域的专业知识，对IBM 旗下的人工智能平台IBM Watson进行训练，以满足日益增长的反洗钱、消费者投诉数据库管理需求。Promontory成立于 2001 年，总部位于美国华盛顿，其创始人Eugene Ludwig为美国前审计长。Promontory 目前在北美洲、欧洲、中东和亚太地区共有 600 名专业咨询师，而这些咨询师此前也都至少是各监管机构、金融组织或财富 100 强企业的中层管理者。目前，公司的主营业务为风险管理、监管合规等，服务的客户中不乏花旗集团、美国银行、摩根士丹利等大银行。此次收购的财务条款细节并没有被披露，这笔交易也还需要得到美国监管部门的批准。

2、IBM联合MIT、哈佛大学，投资5000万美元治疗癌症

近期，IBM与MIT、哈佛大学达成合作，发起了一项新的为期5年、投资5000万美元的癌症基因组计划，利用Waston，帮助理解癌症如何对药物产生耐药性，其中资金都来自IBM。

作为一家电商公司，Amazon很少会在AI这件事上大做PR。但事实上，一方面，AI的相关技术已经被运用在提升电商、物流效率；一方面Amazon也推出了Echo这样的智能音响产品，切入家庭。此外，值得注意的是，Amazon还是全球知名的云服务公司，对于AI技术的需求显而易见。

近期，关于Amazon在AI方面的新闻并不多，主要的媒体报道都是围绕着招聘展开。

1、Amazon组建海外机器学习团队

近期，据外媒报道，Amazon近日正在组建一支全新的海外机器学习团队。谢菲尔德大学机器学习和计算生物学教授Neil Lawrence宣布，带领其学生团队加入。

近期，Amazon的招聘页面上开放了 400 个与 Alexa 相关的职位，包括数据工程师、产品经理、机器学习科学家等。

据华尔街日报报道，Amazon近期从eBay挖走了Hassan Sawa，担任Amazon人工智能主管，提升产品搜索体验。

相比于“AI 伙伴关系”里的五家公司，苹果在AI领域的进展并不明显。连莫博士今年5月都撰文《Can Apple win the next tech war ？》，表达了这种担心。

10月中旬，卡内基梅隆大学的人工智能专家Russ Salakhutdinov表示，他将出任苹果人工智能研究主管。

AI虽然是算法，但芯片等底层技术的支持必不可少。几家芯片大厂也动作频频。

借助AI、VR等新技术的红利，NVIDIA估价一路高歌猛进。在产品层面，也有不少进展。

中基因签名的作用，加速蛋白质交互作用的模拟过程，整理海量癌症患者的资料。

在今年9月中旬的GTC 2016技术大会上，NVIDIA发布了新一代高性能计算卡Tesla P40、Tesla P4，这是专门用于人工智能、深度学习、神经网络的计算卡，采用最新的帕斯卡架构，16nm工艺。媒体报道称，Tesla P40可提供非常高的深度学习工作负载处理能力，一台配备八块Tesla P40加速器的服务器，在性能上可媲美140多台CPU服务器，但成本节省超过65万美元。

3、NVIDIA发布专为自动驾驶设计的Xavier处理器

今年9月底，NVIDIA发布专为自动驾驶设计的Xavier处理器，采用自定义的八核CPU架构，同时内建NVIDIA全新VoltaGPU架构，16nmFinFET工艺，运算性能达到20TOPS，功耗只需20瓦。

1、NVIDIA联合IBM，开发商用深度学习系统

NVIDIA和IBM合作，开发用于加速训练人工智能的系统IBM PowerAI，使用了IBM一款专门为人工智能生产的服务器，采用了NVIDIA的NVLink技术加速机器学习的速度。

2、NVIDIA与京东合作，共建AI实验室

10月中旬，NVIDIA与京东合作，共建AI实验室。

3、NVIDIA与百度合作，发布“从地图到汽车”的自动驾驶平台

9月初，NVIDIA表示已经与百度达成合作，共同创建从云端到汽车的自动驾驶平台，该平台将向中国乃至全球的汽车制造商开放。此次合作结合了百度云平台、地图技术和NVIDIA汽车人工智能计算平台。

4、NVIDIA与九家安防公司合作，启动AI CITY战略

10月底的安博会期间宣布，NVIDIA与9家安防公司达成合作，启动AI CITY战略。其中，合作伙伴包括海康威视、大华、宇视科技、商汤、北京旷视、天地伟业、北京文安、深网视界、久凌等，这些厂商的安防产品中讲很可能采用NVIDIA GPU。

相比NVIDIA，Intel在过去的几个月里主要以“剁手”为主，先后收购、投资了多家公司。

1、Intel 推出深度学习加速器

11月中旬，在世界超算大会 SC16 上， Intel 发布了针对 AI 开发者的深度学习推理加速器，采用 PCIe 接口，搭载了 Arria 10 FPGA ，对卷积神经网络的计算提供更强支持，预计于2017年推向市场。

9月初，Intel 收购了计算机视觉处理芯片公司Movidius，交易详细细节暂未公布。Movidius主要为计算机视觉应用开发芯片，这对下一代智能手机和无人机具有重要意义。Google Tango平板电脑和大疆的精灵4无人机都使用了Movidius的芯片。被收购前公司发布了全新的增强现实与虚拟现实专用芯片。

Machines开发了一种特殊的电路模块，这种模块可以自动将线程分解，然后传递给所谓的虚拟内核，再由这些处理引擎对任务进行分配（虚拟硬件线程），Soft Machines把这种新型的CPU架构称为是VISC。在2014年，Soft Machines推出了500MHz的28纳米工艺原型，后在去年年底做出了16纳米工艺的测试芯片。但目前看来，Soft Machines的收效并不明显，这家投资超过2亿美元的企业，经过近十年的成长，最终以2.5亿美元的价格卖给英特尔。

1、Intel 与科大讯飞达成三年合作

10月，Intel与科大讯飞达成合作，签署合作备忘录，双方将在人工智能领域展开为期三年的深度学习研究项目。根据媒体报道，科大讯飞将以英特尔至强处理器、至强融核处理器、可编程的FPGA为基础，对英特尔产品进行测试并提供反馈，英特尔则将对科大讯飞人员进行培训，并根据其反馈改进自身产品。目前该合作尚处于初级阶段，具体细节还在商议当中。

近期， eBay 推出了基于 Facebook Messenger 虚拟客服机器人平台ShopBot，帮助消费者挑选商品和处理售后等问题。目前，ShopBot 还处于测试阶段，用户既可通过该登录网页版使用，也可在 Facebook Messenger 应用程序内搜索“eBay ShopBot”。

10月，eBay宣布收购以色列计算机视觉公司Corrigon，收购价格在3000万美元左右。Corrigon公司成立于2008年，擅长根据图片来搜索和辨别特定物体，并能将该物体与其他图片和产品链接相匹配。

9月，eBay宣布收购机器学习公司SalesPredict，具体金额暂未透露。SalesPredict研发了一种学习引擎技术系统，能够根据用户的网上历史订单为其推荐可能想买的新商品。该系统也同样适用于市场营销，帮助经销商“瞄准”那些最有可能下单的用户群体。

11月，三星Galaxy S8确认引入了Viv Labs研发的人工智能系统，该系统也能应用于智能家电。

1、三星3000万美元投资英国人工智能芯片硬件设计初创公司 Graphcore

10月底，三星3000万美元投资英国人工智能芯片硬件设计初创公司 Graphcore。该公司计划在明天推出可用于无人驾驶卡车、云计算、机器学习等领域的智能芯片。

2、三星收购语音助手Viv

10月，三星电子表示收购美国机器学习虚拟助手初创公司Viv Labs Inc.，以增强其在人工智能与服务上的能力。据了解，Viv Labs由Siri 之父”戴格·吉特劳斯创办，是一家致力于打造开放式人工智能助理平台，收购之后，Viv Labs及其员工将继续独立于母公司运营。吉特劳斯与该公司其他高管将持续独立管理业务。

1、索尼研发Flow Machines算法，可以根据用户的品味谱写歌曲

近期，索尼巴黎计算机科学实验室（CSL）开发了一套算法系统 Flow Machines，可以根据用户的品味谱写歌曲，适用于所有现有音乐风格。系统在学习了45 首The Beatles的音乐，并模仿其风格创作了一首《Daddy's Car》。

11月，通用电气收购了工业物联网领域（IIoT）的创业公司 Bit Stew，交易金额为 1.53亿美元。Bit Stew 从2009年开始运营，专门利用传感器，从复杂工业系统中的“连接设备”收集数据，帮助公司开展预测性的维护，将服务中断时间最小化。它在2011年取得了最初的成就和认可，BC Hydro选择了Bit Stew为公司客户部署180万部“智能电表”。2015年5月获得了GE领投了Bit Stew 1720万美元的B轮融资，今年的收入则预计将达到1500万美元。

近期，GE 收购机器学习企业Wise.io。Wise.io成立于2012年，总部位于加州伯克利，主要为用户提供有关机器学习领域的技术支持，客户包括Pinterest、Twilio、Thumbtack 等。

日本最大的信息技术提供商 NEC（日本电气）宣布，公司建立了一个名为 NeoFace 图像数据挖掘（NeoFace Image data mining ）系统，可以在10秒钟内从100 万个人中定位某一个人，适用于搜查通缉犯和丢失儿童。

近期，Adobe 在美国圣地亚哥举办举办了 MAX 大会，发布了旗下首个AI底层技术开发平台 —— Adobe Sensei。这一平台利用了Adobe 长期积累下来的大量数据和内容，利用了深度学习技术、机器学习技术，可以是实现自动标记图片、分析视频内容的场景、智能推荐相应特效等功能。API接口将于近期推出。

有没有专业做语音识别技术的优点的企业？

我要回帖

更多关于语音识别技术的优点的文章

随机推荐

有没有专业做语音识别技术的优点的企业？

我要回帖

更多关于 语音识别技术的优点 的文章

随机推荐

更多关于语音识别技术的优点的文章