数据收集公司有哪些

今年 1 月《纽约时报》的一则长篇报道让专做「人脸数据」生意的 Clearview浮出水面,引发了人们对网络数据爬取与个人隐私的担忧一位 Medium 博主日前「申请」拿到了自己在 Clearview 库中的資料,发现事情确实有些复杂

在社交媒体发布自己的照片时,你会不会迟疑一下

如果这张公开发布的图片,被有心人利用呢

如果任哬一个陌生人在街上、在餐厅里拍下你的脸,靠着这张脸就能很快就能搜到你的姓名、住址、工作单位、教育背景乃至你此前在社交网絡上发布过的所有照片呢?这确实是一件可怕的事

有一家名为「Clearview」的公司,会收集你在社交网络上发布过的所有照片建立你的详细资料文档,实现仅用一张脸就能搜出一个人全部资料的功能然后再把这个程序出售给政府机构和警察部门,帮助执法机构确认你有无犯罪記录

在今年 1 月被《纽约时报》报道之前,Clearview 或许只是硅谷众多名不见经传的创业公司之一但这家创立仅三年的公司,数据拥有量却非常驚人:一个简单程序的背后是超过三十亿张图像的数据库。Clearview 宣称这些图像是在 Facebook、YouTube、Venmo 等社交媒体上抓取的这个量级远远超出了美国联邦政府或者任何一家硅谷巨头的数据库体量。

三年多来Clearview 一直在「阴影」中运作。随着媒体的跟进大家发现,这家公司的实际客户也并非呮有「执法机构」工会、房地产公司也会试用该程序对他们认为有风险的人进行判断和标记,此外还有百思买、梅西百货、科尔百货等零售商都曾试用过 Clearview 的程序,但具体用途不得而知

当然,在现阶段Clearview 搜集的资料对于普通人来说并不是触手可得的,因此大部分人还不知道他们究竟能将一个人的信息还原到何种程度但最近,Medium 的一位博主为我们揭开了这个谜底

这位博主名叫 Thomas Smith,是人工智能公司 Gado Images 的联合创始人和 CEO他通过某种方法从 Clearview 手里拿到了自己的个人文档。当然这里说的「某种方法」并不是侵入该公司系统,而是「合法申请」

原本潒 Clearview 这样的公司,是不需要共享其数据的但在今年 1 月 1 日,「加利福尼亚州消费者隐私法案(CCPA)」正式生效该法案对数据搜集和使用权限莋了详细规定。

根据该法案收集消费者数据的企业必须披露收集信息的内容、商业目的以及共享这些信息的所有第三方组织和机构。如果消费者有需求企业须依据消费者提出的正式要求删除相关信息。基于该法案Thomas Smith 向 Clearview 公司提交了获取个人文档的申请。

一个多月后Smith 才收箌 Clearview 的回复,对方要求他填写了一些表格并提供个人照片用来搜索

在申请过程中,他向 Clearview 提供了以下源图片:

在照片发出去几分钟之后Smith 就拿到了包含自己个人信息的文档,其详尽程度让他觉得脊背发凉

Thomas Smith 的文档非常详细,有些甚至他自己都记不太清了比如他参加过的一个 Python 碼农小组、刚结婚时写的一系列博客。

可以说这份文档详细记录了他的活动轨迹,包括 2012 年他的母校校友杂志上发的一篇有关他的文章怹 Facebook 页面的 URL、和他有联系的几个人的名字(红色遮盖的两个部分,包括一名辅导员和一位家庭成员)

最让 Smith 担心的是,文档中信息并非完全囸确其中有一个 Facebook 页面链接是其他人的。Smith 觉得如果调查者认为那是他的化名就会很麻烦,那个页面的人所犯的罪行就会被用来对 Smith 发起指控

Smith 的担心可能并不是多余的。在各种 deepfake 技术风靡的今天如果有人篡改了你的某些信息并将其上传到网上,这部分内容可能也会被收录到 Clearview 嘚文档中并打包发给执法者或其他人

另据《纽约时报》报道,有人在 Clearview 的底层代码里找到了适配 AR 眼镜的编程开发语言也就是说,如果有囚基于 Clearview 的数据开发出一款 VR 眼镜那戴上眼镜的人就可以肆无忌惮地实时窥探视力范围内所有人的隐私信息。

Smith 还指出在当前的法律框架下,创建一家 Clearview 这样的公司其实并没有太高的门槛任何有创业背景的人都可以在一年之内做到。

Smith 提醒大家如果担心自己的脸部照片也被以類似的方式收集,只要你是加州居民或欧盟公民那么 Clearview 在法律上就有义务将你的个人资料提供给你,你要在申请邮件里明确提到 GDPR 或 CCPA 规定

收到数据后,你可以要求 Clearview 删除也可以要求对错误部分进行修改,至少这样可以在一定程度上保护自己

客户数据包含了贵公司所服务的企业和联系人的广泛信息在最基本的层次上,客户数据是了解客户以及您的业务如何满足其需求的重要资产客户数据具有多种表现形式,而且来源也多种多样理解客户数据没有想象中那么容易,尤其是在没有CRM的情况下事实上,仍有很多公司无法有效使用客户数据從而使公司最有价值的资产之一没有发挥应有的作用。在本文中我们将深入地研究客户数据,并探索客户数据管理的最佳实践为了使愙户数据的结构看起来更清晰,我们将其分为四类

基本数据(企业信息和个人信息)是否完善和正确,决定了客户数据能否成为企业的囿效资产在很多CRM中,这些数据都是通用的标准化字段诸如公司的经营信息、联系人的姓名,电子邮件地址电话号码,职务等等是基夲的客户数据示例可用于统计的联系人分类数据(例如性别和收入)或公司统计数据(例如年收入或行业)也是基本的客户数据。

当对哆个联系人或企业客户进行汇总和分析时基本数据将为细分受众群奠定基础。然后通过使用多个分类或标签,你可以开始想象有多少愙户有着共同的属性

交互数据包括客户与贵公司的接触记录。交互数据对于在整个业务周期中了解客户非常有用例如,因客户请求而茬公司内部发起的流程、销售或客服的沟通记录、购买记录(订单数据)等等都是常见的示例

交互数据通常用于汇总以生成更高级的数據报告(并且具有“向下钻取”以获得更多见解的能力)。例如统计一段时间总共给所有客户优惠了多少(从客户请求优惠的申请流程Φ统计),客户请求产品演示的次数(从产品演示申请流程中统计)了解销售或客服人员对客户的跟进或服务频率(从行动记录数据中統计)、销售报表和产品销售排行榜(从订单数据中统计)等等。

行为数据可洞悉客户对您实际产品、销售流程或服务的体验注意:交互数据和行为数据之间的差异似乎有些细微差别,具体取决于您的业务和行业行为数据通常是客户的主要联系人与贵公司发生业务往来嘚直观反馈,例如主动申请试用注册(积极)主动沟通需求(积极),对产品提出合理地改进意见(积极)拒接电话(消极),预算減少(消极)等等

一个公司的客户群体通常有着相似的行为,通过维护好这些行为分类数据对于了解每一个客户的偏好并确定未来的趨势至关重要。比如贵公司只提供远程服务而某个客户要求必须上门服务,那么就可以为该客户贴上一个“要求上门服务(消极)”的荇为标签从而将该客户的跟进优先度降到最低。

反馈数据可帮助您了解客户对您公司或产品的看法与其他三种类型的数据不同,反馈數据是提供客户实际想法的第一手资料诸如在线评论和满意度调查是反馈数据的重要来源。

但是对待反馈数据有一个问题:在表达对贵公司的意见时某些客户比其他客户更为合理中肯。来自不满意的人的严厉评论是否真的反映了您整个客户群的情感可能是也可能不是。这就是为什么贵公司要在重要的客户群中连续主动地收集反馈数据

如何收集和管理客户数据

一旦您的团队牢牢掌握了这四种主要的客戶数据类型,他们就可以开始讨论如何最好地收集这些信息在制定数据收集和管理计划时,需要考虑以下几个问题

1、您的客户数据目標是什么?
您是否想利用数据来改善客户体验或开发新产品或功能您是为了加速收入增长或最大化利润?您是希望通过有效使用客户数據来降低客户流失率在陷入数据对话的细节之前,先讨论一下“为什么”

2、我们行业中的其他公司如何利用客户数据?
研究与您类似嘚公司如何以安全和可扩展的方式利用客户数据他们的数据目标是什么?用此来发现和补充您的客户数据战略

3、哪些数据必不可少?
錄入完整的客户数据需要付出努力并且很可能需要前期机会成本。您可能很难获得所需的所有数据而且,有些数据未必对您的业务有鼡弄清楚哪些数据对您当前和将来的业务状况至关重要?它如何与您陈述的数据目标保持一致首先对最重要的数据进行排序,并保证您的CRM具有数据扩展性以备将来使用它们

4、访问和管理数据的成本是多少?
您当前的CRM是否提供令人满意的界面以正确提取和呈现您的客户數据如果您还没有CRM,那么建议您开始评估并准备采用一个正确的CRM系统

5、我们将如何维护干净的数据?
没有人想要充斥着错误和重复的數据但是,如果没有正确的CRM系统和客户管理流程则不良数据将变得非常常见。为了保持数据干净请采取主动的重复数据删除措施,對员工进行良好的培训并寻求CRM的自动化机制来减少手动调整数据的次数。

显然客户数据比以往任何时候都重要——以客户为中心的战畧成为企业构筑竞争壁垒的有效屏障。通过采用正确的CRM系统和流程贵公司将能够有效利用客户数据发展业务并实现更多目标。您是如何管理客户数据的呢您使用什么系统和流程来帮助您充分利用对客户的见解?您可以从知客CRM获得免费的需求评估并为您的近期和长期客戶数据管理目标讨论最佳解决方案。

国内的大数据公司我知道的有阿裏云海致BDP,浪潮等每个公司可能侧重点不一样。

本回答由上海时代光华教育发展有限公司提供

一、大数据公司互联网巨头

互联网巨头嘚起家背靠着电商社交,信息游戏,金融等互联网时代的巨大概念

腾讯拥有用户关系数据和基于此产生的社交数据,腾讯的思路主偠是用数据改进产品注重QZONE、微信、电商等产品的后端数据打通。腾讯的未来在于微信微信现在已经不再把精力放在IM通讯上了,而是连接一切未来微信很有可能会成为整个互联网的基础服务最大的入口。那时候的微信也就掌握了电商社交,信息游戏,金融的一切

互联网是个神奇的大网,大数据和软件定制也是一种模式这里报价,这个手技的开始数字是一把柒中间的是叁儿零最后的是一泗贰五零按照顺序组合起来就可以找到,我想说的是除非你想做或者了解这方面的内容,如果只是凑热闹的话就不要来了。

阿里巴巴拥有交噫数据和信用数据,更多是在搭建数据的流通、收集和分享的底层架构其中阿里巴巴的淘宝,天猫阿里巴巴,支付宝商品交易,支付數据是商业的基础设施支付宝的交易数据使得阿里长期在互金领域占据霸主地位。电商超越零售不是现在就是不久的将来。所以阿里目前拥有的网商数据也就等于掌握了中国部分的商业占比。

百度的百度搜索百度对于信息的利用来源于用户与商家的需求,用户侧服務互联网网民的搜索需求商家侧匹配广告主与网民的广告业务。另外百度还重金押宝AI,AI若能成功将革新社会的基础服务比如无人驾駛。所以个人觉得百度仍然有机会回到第一的王座

凭借着互联网时代庞大的数据体量与高质量的数据,可以说BAT拥有着当今最优秀的数据囚才

二、大数据公司行业巨头

行业巨头个人分为两类。

第一类是IT巨头例如开运联合,小米新美大,浪潮中兴,曙光等公司他们憑借着在IT领域建立了技术壁垒或者服务能力,成为了各自领域的佼佼者

第二类是传统行业巨头,包含各行各业金融,零售能源,机械酒等垂直领域。比如你听说过茅台酒公司的大数据平台吗?

由于上述行业巨头的垂直领域数据的垄断性地位与数据体量的变大希冀能依靠数据产生价值 。凭借着两点行业巨头也拥有着很多高质量的数据人才。

但数据不是他们的第一驱动力他们有更重要的主营业务。

這类型大数据公司的主要特点是依赖于Hadoop大数据工具针对市场需求,为市场带来创新方案并推动技术发展

四、大数据新时期公司(即大數据第三方服务公司)探码大数据

新时期大数据公司个人分为基础服务平台、商业数据分析两大类。

基础服务平台提供了数据平台基础服務比如大数据存储平台,计算平台BI平台,数据交易平台

商业数据分析型大数据公司提供了复杂的端到端数据服务,包括数据采集、清洗、分析帮助没有数据分析与整合,能力的企业理解数据,认识数据并让自身数据发挥效用。

接下来我们主要谈谈一些大数据新时期公司即大数据第三方服务公司。他们的特色重点在Web数据采集服务专业针对互联网数据抓取、处理、分析,挖掘可以灵活迅速地抓取網页上散乱分布的信息,并通过强大的处理功能准确挖掘出所需数据,是目前使用人数最多的网页采集工具

它有四个比较显著的特点:

不需要使用任何的软件,只需要告诉我们您的目标网站和你感兴趣的内容就能获取我们为您抓取的数据

能从任何的网站上获取任何数據,无论是静态的还是动态的页面获取数据都变得十分轻松.

对于一个需要20个人工作日完成的工作,我们能在数小时内完成省钱又省力,还能让您领先于您的竞争对手.

抽取结果的每一列都是您所需要的不多也不少。同时会按照您的要求对数据进行过滤和校验

“大数据”菦几年来可谓蓬勃发展它不仅是企业趋势,也是一个改变了人类生活的技术创新大数据对行业用户的重要性也日益突出。掌握数据资產做大数据致店一把柒叁二零一泗贰五零。进行智能化决策已成为企业脱颖而出的关键。因此越来越多的企业开始重视大数据战略咘局,并重新定义自己的核心竞争力

在本文中,作者整理了在中国境内活跃的大数据领域最具影响力的企业它们有的是计算机或者互聯网领域的巨头,有的则是刚刚创办不久的初创企业但它们有一个共同点,那就是它们都看到了大数据带来的大机会并毫不犹豫地挺進了这个领域。

首先来盘点一下那些提供大数据工具的老牌厂商看看他们是如何利用自身优势地位冲击大数据领域,并将新产品及新方案推广到新一轮技术浪潮当中?

大数据是比云计算还要新兴的一个术语但是从(表一)中列举的一些公司不难发现,在业内大数据被科技企業看作是云计算之后的另一个巨大商机,包括IBM、微软、谷歌、亚马逊等一大批知名企业纷纷掘金这一市场;另外很多初创企业也开始加入箌大数据的淘金队伍中,如Cloudera、Clustrix等但纵观国内大数据服务提供商市场,大数据这一概念对国内企业来说或许还稍显陌生,在最具影响力嘚前30家企业中国内企业几乎还是一片空白,相对来说国内大数据起步较晚,但依旧有些企业不遗余力的投入大数据这片蓝海并且发展态势良好,下面就来盘点下大数据领域国内的主力阵营吧!

国内做大数据的公司依旧分为两类:一类是现在已经有获取大数据能力的公司如百度、腾讯、阿里巴巴等互联网巨头以及华为、浪潮、中兴等国内领军企业,涵盖了数据采集数据存储,数据分析数据可视化以忣数据安全等领域;另一类则是初创的大数据公司,他们依赖于大数据工具针对市场需求,为市场带来创新方案并推动技术发展其中大蔀分的大数据应用还是需要第三方公司提供服务。

越来越多的应用涉及到大数据这些大数据的属性,包括数量速度,多样性等等都是呈现了大数据不断增长的复杂性所以,大数据的分析方法在大数据领域就显得尤为重要可以说是决定最终信息是否有价值的决定性因素。基于此对大数据进行分析的产品有哪些比较倍受青睐呢?

而在这里面,最耀眼的明星当属HadoopHadoop已被公认为是新一代的大数据处理平台,EMC、IBM、Informatica、Microsoft以及Oracle都纷纷投入了Hadoop的怀抱对于大数据来说,最重要的还是对于数据的分析从里面寻找有价值的数据帮助企业作出更好的商业决筞。下面我们就来看看以下十大企业级大数据分析利器吧。

随着数据爆炸式的增长我们正被各种数据包围着。正确利用大数据将给人們带来极大的便利但与此同时也给传统的数据分析带来了技术的挑战,虽然我们已经进入大数据时代但是“大数据”技术还仍处于起步阶段,进一步地开发以完善大数据分析技术仍旧是大数据领域的热点

在当前的互联网领域,大数据的应用已经十分广泛尤其以企业為主,企业成为大数据应用的主体大数据真能改变企业的运作方式吗?答案毋庸置疑是肯定的。随着企业开始利用大数据我们每天都会看到大数据新的奇妙的应用,帮助人们真正从中获益大数据的应用已广泛深入我们生活的方方面面,涵盖医疗、交通、金融、教育、体育、零售等各行各业

大数据服务范围比较广,不知道你说的是那一块我知道做大数据的,像网易、阿里、数道云大数据……………………

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

我要回帖

 

随机推荐