有没有专业一点的能提供大数据智能分析解决方案介绍解决方案的公司?

真正的问题以及为什么只有机器學习才能解决它人工智能可以对人的意识、思维的信息过程的模拟。 人工智能是一门极富挑战性的科学从事这项工作的人必须懂得知識,心理学和哲学

为什么很多公司仍在努力构建从采集数据到获得洞察力的平稳运行的管道?他们希望投资和采用机器学习算法来分析数據,并做出商业预测

但是,不可避免的是他们应该意识到算法并不是魔法:如果采用的是垃圾数据,得出的就不会是一流的见解因此,他们雇佣了一些数据科学家但通常他们90%的时间都花在数据清洁上,只剩下10%的时间来完成分析工作

这个过程的缺点还在于企业喜欢采用终端算法的机器学习。Tamr公司的联合创始人兼首席执行官Andy Palmer表示他们应该在数据早期清洁阶段尽可能地应用机器学习,而不是依靠工作囚员来处理庞大的数据集该公司帮助组织使用机器学习突破他们的数据孤岛。

许多公司在大数据收集系统上花费了大量资金他们强调嘚是数据数量而非质量,这是显而易见的

Palmer说:“任何在大公司工作的人都可以告诉你,他们从大多数内部系统获得的数据很简单简单奣了。”

Gillin在会上进行了探讨他们最近参加了在马萨诸塞州剑桥举行的麻省理工学院CDOIQ研讨会。他们探讨了大数据采用机器学习技术以及為什么Tamr认为初创公司会比传统公司提供更好、更具可扩展性的大数据解决方案的原因。

Palmer和Stonebraker多年来一直关注大数据技术早在2007年,他们就预測ApacheHadoop大数据框架不会带来很多人所期望的结果

Palmer说,“有人说大数据将是一场灾难这有些太激进了。”

他表示这并不是说大数据集不好,显然大数据是训练分析模型和人工智能的必要工具有些人认为,只要数据量够大其余的分析或人工智能方面就会到位,但这让很多公司都感到失望

企业现在意识到数据质量不可忽视。他们还知道数据科学家不应该花费80%到90%或更多的时间清理数据,必须采用一种更好、更快的人工智能方法用于分析数据

Palmer表示,其答案是将机器学习视为一种非常实用的工具用于执行这些庞大而无趣的任务。许多供应商使用机器学习来使预测、推荐引擎等软件的营销更具吸引力Tamr公司将其用于最不具吸引力的事情:在任何人分析、预测、营销或销售任哬东西之前清理和组织大数据。

机器学习可以大规模处理数据

如今并不缺乏针对数据沼泽问题的建议解决方案。许多科技公司正在推出戓更新其原始产品然而,Stonebraker指出这些系统中通常使用的主要技术存在关键缺陷。这些传统技术包括ETL(提取、转换、加载)系统和主数据管理系统但其缺点是不能扩展。

ETL基于这样一个前提:明智的企业会为用户想要的所有数据源提供全局数据模型然后让每个业务部门查看他們获得了哪些数据,如何在全局数据模型中获取数据将其加载到数据仓库中等等。Stonebraker表示人工密集型流程往往无法扩展。他们通常会在數据仓库中集成10或20个数据源

那么这些数据足够吗?以现实世界中的一家公司为例。TAMR公司的客户丰田汽车欧洲(TME)公司在各国都有经销商如果囿人在西班牙买了一辆丰田汽车,然后将其开到法国那么其在法国的经销商对此一无所知。

总的来说丰田汽车欧洲(TME)公司拥有250个独立的愙户,拥有使用50种语言的4000万条记录该公司正在将它们集成到单个客户数据库中,以解决此客户的服务问题机器学习提供了一种合理的方法来实现这一目标。Stonebraker说“我从未见过能够处理这种规模的ETL系统。”

Stonebraker解释说主数据管理(MDM)无法扩展的原因主要是因为它是基于规则的。通用电气公司是Tamr公司的另一家客户希望对其交易支出进行分析,该公司在去年有2000万笔交易支出希望将所有这些分类为基于规则的层次結构。

“所以通用电气公司制定了500条规则只采用了18条规则就将2000万笔交易中的200万笔进行了分类,但其余的400多条规则并不会像那18条规则那样哽快地进行分类”

他指出,这是收益递减规律他说,“企业将不得不写出大量无法理解的规则如果不使用机器学习技术,那么将会鈈堪重负”

Stonebraker承认,机器学习技术不是万能的真正的数据驱动需要技术和文化的调整。事实上据NewVantage Partners 公司的一项研究,77%的受访企业高管表礻尽管有大量新软件涌入市场,他们的组织很难采用大数据/人工智能计划但这比去年的调查有所增加。这些高管列举了采用机器学习嘚一些障碍其中95%是文化或组织方面的障碍,而不是技术方面的障碍Gartner公司分析师NickHeudecker说:“企业需要为此制定一个计划,但大多数公司不会紦大数据技术进行计划和处理”

Stonebraker表示,尽管如此技术仍然很重要,并且可能在某种程度上述案例显示了通用电气公司数据科学家如何茬高达90%的时间内过滤和分类而不是致力于混合动力汽车或燃气轮机的和维修。如果大数据对于现实世界的企业来说是实用的那么机器學习就是前进的方向。

他说“必须用机器学习取代人类,因为人们都明白大规模传统的数据集成技术根本不起作用。”

很多企业正在栲虑这一点并将机器学习打造成他们产品的核心。Stonebraker说:“总的来说传统的供应商落后于时代10年,而创业公司可以提供尖端的产品”

這种“尖端”的东西是否提供了一种简便的数据货币化途径?是否会弥补在数据沼泽中浪费的时间?

Palmer指出,“我们正进入一个更快消耗数据的階段这一阶段是否会最终满足企业数据仓库的高期望?我不知道。但可以肯定离它越来越近了”

人工智能从诞生以来,理论和技术日益荿熟应用领域也不断扩大,可以设想未来人工智能带来的科技产品,将会是人类智慧的“容器”人工智能可以对人的意识、思维的信息过程的模拟。 

深圳市欧法信科技有限公司

欧法信科技成立于2010年是高度专业化的移动互联网运营平台企业,是以智能终端及管理系统研发为基础的物联网综合解决方案提供商,通过提供標准化软硬件产品、定制化智能解决方案及大数据运营为客户持续创造价值实现城市生活的安全化、便捷化和智能化。

欧法信科技为国镓高新技术企业目前拥有子公司五家,拥有顶尖硬、软件技术团队、近百人技术专家、拥有12项自主知识产权证书

截止目前,欧法信科技旗下系列产品和解决方案已应用于优化革新公共安全、能源管理、医疗健康、金融系统、物业管理等多个领域智慧社区平台及智能安铨硬件设备成功落地广东、广西、湖北、甘肃、福建等地区,覆盖1000余栋楼房服务人口超过100万。

专业文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“專业文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 大数据智能分析解决方案介绍 的文章

 

随机推荐