本文通过以下七部分拆解数据分析:

一、什么场景和行业需要数据分析

二、数据分析会骗人吗?

三、怎样排除虚假流量?

四、PC端数据分析指标&方法论

五、电商、金融行业数据分析

六、数据分析的趋势

七、怎么培养数据分析的能力?

先进部分先拆解一、二、三部分

“无法度量,就无法管理”

——管理大师彼得·德鲁克

这说明了数据对于管理的重要性。在日常的运营和决策中,数据扮演的是一个辅助角色。举个比较贴切的例子,如果汽车相当于生意,那用仪表盘来比喻数据是最贴切的。脱离仪表盘,车照样可以开,但想要把车驾驶得精益求精,这时就要依靠仪表盘了。所以数据是常规运营和决策的良好辅助,对于常规价值的增值能力,是数据最核心的价值。

一、什么场景和行业需要数据分析

真正系统性的网站分析大概只发展了十年左右,相比统计学、经济学等其他成熟学科,网站分析还是比较年轻的。

我从传统零售业慢慢接触到了互联网领域,算是比较早接触数据分析的。之前在传统零售行业,接触到的基本上都是市场数据和销售数据,采用购物车追踪器、会员系统、店面观察员、市场调查员等方式获取数据,数据分析的成本不低,并且要获取细致的用户行为数据非常难。当我逐步接触到互联网在线数据分析之后,通过用户行为定位、用户行为追踪的技术,能非常轻松地解决先前传统行业的那些难题。

所以到底什么样的场景需要数据分析呢?我认为只要能产生可靠的数据,运营者有意愿通过数据为生意增值的场景都是需要数据分析的。航空业、金融业、电信业是数据分析发挥价值较高的三个行业。这些行业的用户有实名制,用户的每次交易也都是实名的,用户信息相对更准确,对用户的分析就会更准确。

二、数据分析会骗人吗?

先进种情况,数据是客观存在的,它不会主动骗人,真正骗人的是数据使用者。现在谈论较多是虚假流量的话题,用机器模拟流量数据混入正常数据里,污染真实数据。即使你有非常高明的手段也很难排除所有的机器流量。这种情况下去做数据分析,把机器数据当做人的行为去揣测,用分析机器行为的结论去服务你的用户,这种错误的分析对真正的决策会产生很大的影响。

第二种情况,选用的数据分析方法不恰当或对某种方法的使用领域了解不够,导致数据分析对决策产生干扰。以数据抽样为例,如果你的数据抽样样本属性不恰当,会造成整体数据的偏差。一个电商网站如果选取了80%的女性数据和20%的男性的数据开展分析,那么女性的数据特征就会对抽样的整体造成数据偏差。

第三种情况,在于数据能力所不能及的问题。数据不是万能的,一些情感类、风格类的数据是不能完全数据化的。最简单的例子,汽车广告应该投到时尚类、运动类、旅行类等比较贴切的场合,如果你把一个中高端汽车广告投放到一个有笑话、恶搞的环境中会使广告的效果大打折扣。但目前来讲,数据还不能完全识别这样的投放环境。另外,数据只能通过一些表象特征去分析,捕捉不到人情感的细微变化,人和人面对面的销售方式反而能捕捉到一些变化。

三、怎样排除虚假流量?

虚假流量的作假手法和排除手法每年都在升级。从字面上讲,虚假流量可以分成虚流量和假流量,二者本质上是有些区别的。

非人为的流量我们会把它归类到虚流量里面,比如说蜘蛛的爬虫,它不是恶意的,而是自然而然产生的,它只是让网站流量虚高,一些测试流量和垃圾流量也都属于虚流量。

假流量是因为有利益驱使人为造假,主要涉及以下手段。

一、刷量。这种方法比较简单粗暴,比较容易被识破。可以通过时间段排查,因为机器没有正常的作息,如果简单设置为24小时平均刷,每周7天平均刷,这就违背了人的正常作息时间。还有一些虚假流量是通过机房多设备刷量,机房的特点是IP统一,配置、屏幕大小、操作系统和浏览器都差不多,也是比较容易识破的。

二、模拟鼠标坐标。有些刷量考虑的非常周全,用不同的IP地址、产生不同的访问、延迟情况,甚至能够模拟实时的鼠标坐标。但难免有破绽,人从一个点到另一个点的移动很难做到是一个标准的直线,而模仿的轨迹都是点到点的,全部都是直线,它不会拐弯。所以也能识别出来。

三、技术性的假流量。它可以远程控制机器,然后植入木马,诱骗你去点击一些乱七八糟的网站,实现刷量的目的。这种很难识别,因为产生这个动作的是真实的人,甚至还会产生真实的交易。

四、刷量群。他们类似淘宝刷单,加入刷单群之后,群主一声令下,点击什么网站,跟客服发生三句话以上的咨询,这些流量就都传送过去了,这都是人的行为,而且这些群里的人天南海北,产生的行为也都特别真实,所以这样的假流量很难甄别。

五、数据监测死角。还有些渠道很难监测,比如微信朋友圈、今日头条的信息流,它们属于监测的死角,没有任何依据去判断真假。虚假流量还有一个产业链,这个就比较复杂了,找到其中的破绽需要通过很多角度来做数据验证,但也是有抓的办法,我们也在研究一些抓虚假流量的工具,做多角度抓取此类虚假流量的尝试。

抓假流量固然重要,但比这更重要的是防范假流量。

先进个建议,坚持用可靠的数据监测工具,并且和广告商、媒体争取用抓取到的数据进行广告费结算。

我有一笔广告费,要在你这里做广告,但是你要同意我使用第三方的工具进行监测,监测到什么数量,就给你多少广告费。这有两层目的,一是节省广告费,二是威慑作用,比如让媒体知道你用了知名的反作弊工具比如谷歌的DoubleClick,在造假时就会忌惮三分。一般媒体会同意你使用第三方的监测工具,但它会要求做测试,你相信这个工具,但媒体不相信。这时要防范一些比较老道的媒体会向你要“分时段数据”,他们要这些数据只是为了看一下在哪一个时段的作弊手段没有被工具检测到,等到正式投放的时候,应该使用哪一种作弊手段。

第二个建议,在企业内部使用辅助KPI做数据真实的验证。

明面上的考核是要公布给媒体和代理商的,他们知道选取什么样的渠道才能完成KPI,达到什么样的量级才能结算广告费。辅助KPI比如用户行为特征、行为习惯,这些是用户的行为特征数据,可以不向媒体公布。如果是假流量,是难以符合常规的行为习惯的,这个可以作为假流量的依据。

第三个建议,对初次合作的媒体一定要做重点检测。

初次合作的媒体通常认为会比较“老实”,但真实情况却不尽然,媒体非常清楚初次合作的数据可能会作为后续合作的基准线,同时也要向广告主表明对于KPI的完成情况,所以反而会在合作初期冒险掺入一些假流量,即使被怀疑也可以用初次合作测试数据不稳定的理由搪塞过去,所以对于初次合作的媒体,更需要多加小心,通过各维度行为数据来验证流量的真实性。

 

·END·

本文是巨推传媒(CALL:400-606-5558)网原创,版权归巨推传媒(CALL:400-606-5558)网所有,未经授权,禁止转载!转载联系Wechat:biaoshi5151

 

巨推传媒(CALL:400-606-5558)网——网络推广严选网(http://51biaoshi.com),提供微信代运营、小程序开发、微信推广、SEO、SEM、口碑营销、广告投放等服务。推广找巨推传媒(CALL:400-606-5558),效果有保障。