bi理论成功案例考试作bi弊方法有什么,有这方面的设备器材吗?

技术的进步增加了广告投放的效率和效果,也带来了更凶猛的作BI。

这是一个永恒不灭的话题。

品牌广告的作BI一直以来被人诟BING,效果类广告的虚假流量其实也很猖獗。

线上营销的成本不停升高,再加上LIU量掺水作假,对广告主而言,不啻为一个黑暗的考验。

流量作BI现象有多厉害?

AdMaster刚刚发布了2018年上半年的数字广告无效流量白皮书。数据显示,2018 上半年,上千家广告主企业(行业范围涵盖快消、母婴、汽车、餐饮、金融、互联网等各行各业),无效流量占比为 28.8%,同比 2017 年上半年无效流量的占比 29.6%和 2016 年上半年无效流量的占比 30.4%,虽逐年有小幅下降,但形势依然严峻。接近三分之一的流量是有问题的流量。

而流量的来源上,垂直门户一直都是重灾区。再加上今天的网民行为的迁移,垂直门户的日子只会越来越难过。

媒体行业细分来看,还是品牌类广告行业的无效流量占比多。而且,女性相关媒体的流量情况触目惊心,接近50%!汽车行业媒体的流量作BI有所抬头。

与常识不同,AdMaster给出的移动端的作BI少于PC端。但并不奇怪,因为AdMaster监测数据主要覆盖的是品牌广告主,尤其是视频贴片+信息流+开屏等广告。如果包含了其他的移动端ADX以及效果类的广告,从我们投放的经验上看,移动端的作BI,尤其是安卓系统的作BI,比PC端严重太多。

发现效果类作BI只要牢记几点,其实避免并不困难。

1、对流量的细分标记一定要做好

你不做细分流量,怎么发现什么流量有问题呢?

细分流量一般有两种方法,最常用的是link tag的方法(公众号对话框回复“标记”,查看操作详情)。

另外一种方法,是直接给每个不同的流量不同的落地页,不想做不同页面的话,同一个页面不同URL即可。同样可以区分出不同的流量。这种方法用得少,但是在不能给流量做link tag的时候,这个方法很解决问题。

2、查看各个细分流量的用户行为

这些行为已经不能只是透过简单的跳出率来查看了。

我们需要看更加具体的用户的行为,诸如点击的分布,设备的分布,地域的分布,时间的分布,互动时间与参与状况等。显然,大部分效果类的作BI,都很难真正的模拟人的行为,所以,发现作BI其实真正无敌的方法,就是看这些流量的行为是不是“真人”。

没错,利用一定的方法,你肯定能分辨出来。具体方法点击文章:为什么投信息流广告,有钱花不出去?原因全在这!在这篇文章中,你会看到出现严重问题的流量是怎么被发现与证实的。

3、查看流量的行为演进过程

作BI流量和低质量流量的共同特征,就是:它们不会往交易的更深处“演进”。

对于转化需要多个步骤完成的业态,这个方法尤为有用。比如,这些流量集中在落地页,但是停留在这里,不再继续发展。一般这些流量背后不是机器,但垃圾无效流量较多。

行为演进的细分与分析,还能够帮助我们发现一些客户端的劫持。典型特征是,当流量演进到购物车或者支付环节的时候,就不再继续进行下去了。而另外一些流量则莫名其妙的以购物车或者支付环节为落地页。

不过,有一类效果作BI基本上没有办法能够被找出来,即互联网基础通信服务端发起的劫持。唉,当一个流量一出现的时候,就已经被人从头到尾改换了门庭,而且还是从互联网基础设施的角度改换的。

那就真心没办法能查能堵了。正因为如此,这一类作BI,是目前效果类作BI的最严重的,屡禁不止呀(关键也没有任何强力机构会禁止这种抢钱行为)。

虽然说你不能真正发现这类作BI,但还是可以“能感觉到”。比如,当你真的停掉那些ROI很差或者“毫无作为”的流量了以后,那些看起来本来很好的流量渠道也应声下降。

品牌类的作BI,按照AdMaster上面的数据,大约三分之一的流量有问题。

品牌类的作BI的发现,较效果类要困难。直接原因,品牌类广告的目标是影响消费者的心智,而不是直接作用于消费者的行为。

可是,直到今天,也没有什么特别有效且高效的方法去衡量消费者的心智变化。因此,品牌类广告的投放,在作BI方面天然“有优势”。

发现品牌类投放的作BI流量,主要有如下方法:

Click的点击频次应不高于1.1,而1.2以上基本上存在很大问题了。Impression的频次作为指针相对比较弱,但如果发现有局部IP普遍频次超过10,那么虚假的可能性也很大。

2、与效果类类似,如果流量有落地(网站、app、小程序之类),那么查看流量的行为。

这一块,我经历了有很多有意思的故事。比如,早些年,某些垂直媒体贡献的流量极为巨大,但是跳出率极高。若干年后,有一些不明渠道的“运营商弹窗”流量,也是每天海量流量,但是却几乎没有任何在页面上的行为。

还有很多app的下载推广,app确实也下载了,可是从来没有见过激活。或者激活了,从来没有见过使用。这些都是典型的机器流量。

比如,AdMaster有这样的黑名单,在对广告进行监播的同时,会查看浏览广告或者点击广告的IP、device ID、cookie等。这种方式目前也是主流的发现品牌端作BI的方式。

至于怎么知道这些IP、device ID或者cookie后面的流量是作BI的,主要的原因在于,这些监测第三方收集的数据比广告主要多很多,因此,更容易察觉出异常的行为。

4、借助具有公信力的第二方DMP

如果能够拿到广告投放之后的覆盖人群的device ID或者其他ID,那么你也可以将这些数据上传给阿里品牌数据银行或者腾讯DMP之类的第二方DMP(请注意,很多人认为他们是第三方DMP,但实际上中国基本上没有严格定义上的第三方DMP)。之后,你能看到这些人群的ID与第二方DMP的ID匹配率往往很低,而且就算有匹配,人群的数据也完全驴头不对马嘴。

这个方法主要用来检查那些定向投放的视频广告是否“作BI”。简单讲,视频广告尽管一般不会提供固定的广告位保证,比如我要投放某个节目前面的前贴片,这种媒体是不会承诺的,但是媒体还是会承诺节目类型,比如投放在美剧,或者投放在社会新闻之类。

不过,媒体不会提供具体的投放位置的URL。解决这个问题的方法很简单,第三方追踪广告投放环境(页面)的URL,并且分析这个URL页面具体的内容是否与承诺的节目类型的内容符合。

这种方法其实对于程序化广告的投放基本上都是比较适用的,本质上程序化投放的品牌安全性也是来自于这种方法。

6、移动端:利用其他硬件识别信息

这个方法也需要第三方帮助,但是道理很简单:作BI设备不会随着人到处跑,因此它们的硬件识别信息,尤其是网络环境相关信息、LBS相关信息等,基本上处于永远不变化的状态。这样能够帮助发现可疑设备。

7、反模拟器与反肉鸡流量

另外一些作BI用的模拟器或者肉鸡之类。模拟器和肉鸡仍然是机器,因此,它们的行为与人的行为实在有太大的差别。但由于品牌广告的投放,有时候并不看受众的行为——只是为了获取曝光,那么这种情况下,仍然需要依赖于第三方帮助识别。

第三方识别这些肉鸡的方法有几种,包括利用特征库做相似性学***(有点类似于机器学***,用现有的肉鸡库或者模拟器库里面的机器行为比对被测流量的行为),做这些流量的行为特征分析(第三方能够有一定的跨域追踪这些流量的能力)等。

总体看,随着流量进入下半场,流量的价格变得更贵,作BI的情况只会变得更加复杂,而不会更加简单。流量作BI识别已经不再是仅仅查看流量访问行为本身,而不得不通过技术把它们作为一个具有更长线行为的“人”来看待,方能知道它们原本“不是人”。

不论是学习概率统计还是机器学习的过程中,贝叶斯总是是绕不过去的一道坎,大部分人在学习的时候都是在强行地背公式和套用方法,没有真正去理解其牛逼的思想内涵。我看了一下自己学校里一些涉及到贝叶斯统计的课程,content里的第一条都是Philosophy of Bayesian statistics


什么事都要从头说起,贝叶斯全名为托马斯·贝叶斯(Thomas Bayes,),是一位与牛顿同时代的牧师,是一位业余数学家,平时就思考些有关上帝的事情,当然,统计学家都认为概率这个东西就是上帝在掷骰子。当时贝叶斯发现了古典统计学当中的一些缺点,从而提出了自己的“贝叶斯统计学”,但贝叶斯统计当中由于引入了一个主观因素(先验概率,下文会介绍),一点都不被当时的人认可。直到20世纪中期,也就是快200年后了,统计学家在古典统计学中遇到了瓶颈,伴随着计算机技术的发展,当统计学家使用贝叶斯统计理论时发现能解决很多之前不能解决的问题,从而贝叶斯统计学一下子火了起来,两个统计学派从此争论不休。


什么是概率这个问题似乎人人都觉得自己知道,却有很难说明白。比如说我问你 掷一枚硬币为正面的概率为多少?,大部分人第一反应就是50%的几率为正。

不好意思,首先这个***就不正确,只有当材质均匀时硬币为正面的几率才是50%(所以不要觉得打麻将的时候那个骰子每面的几率是相等的,万一被做了手脚呢)。

好,那现在假设硬币的材质是均匀的,那么为什么正面的几率就是50%呢?

有人会说是因为我掷了1000次硬币,大概有492次是正面,508次是反面,所以近似认为是50%,说得很好(掷了1000次我也是服你)。

掷硬币的例子说明了古典统计学的思想,就是概率是基于大量实验的,也就是 大数定理

那么现在再问你,有些事件,例如:明天下雨的概率是30%;A地会发生地震的概率是5%;一个人得心脏病的概率是40%…… 这些概率怎么解释呢?

难道是A地真的100次的机会里,地震了5次吗?

肯定不是这样,所以古典统计学就无法解释了。

再回到掷硬币的例子中,如果你没有机会掷1000次这么多次,而是只掷了3次,可这3次又都是正面,那该怎么办?难道这个正面的概率就是100%了吗?这也是古典统计学的弊端。


一种癌症,得了这个癌症的人被检测出为阳性的几率为90%,未得这种癌症的人被检测出阴性的几率为90%,而人群中得这种癌症的几率为1%,一个人被检测出阳性,问这个人得癌症的几率为多少?

猛地一看,被检查出阳性,而且得癌症的话阳性的概率是90%,那想必这个人应该是难以幸免了。
那我们接下来就算算看。

A表示事件 “测出为阳性”, 用 B1?表示“得癌症”, B2?表示“未得癌症”。
根据题目,我们知道如下信息:

那么我们现在想得到人群中检测为阳性且得癌症的几率

P(B1?A)表示的是联合概率,得癌症且检测出阳性的概率是人群中得癌症的概率乘上得癌症时测出是阳性的几率,是0.009。

这个概率是什么意思呢?其实是指如果人群中有1000个人,检测出阳性并且得癌症的人有9个,检测出阳性但未得癌症的人有99个。可以看出,检测出阳性并不可怕,不得癌症的是绝大多数的,这跟我们一开始的直觉判断是不同的!可直到现在,我们并没有得到所谓的“在检测出阳性的前提下得癌症的 概率 ”,怎么得到呢?很简单,就是看被测出为阳性的这108(9+99)人里,9人和99人分别占的比例就是我们要的。

P(B2?A)中间多了这一竖线,表示的也是条件概率,而这个概率就是贝叶斯统计中的

前面提到的人群中患癌症与否的概率

我们知道了先验概率,根据观测值(observation),也可称为test evidence:是否为阳性,来判断得癌症的后验概率,这就是基本的贝叶斯思想,我们现在就能得出本题的后验概率的公式为:

由此就能得到如下的贝叶斯公式的一般形式。

参考资料

 

随机推荐