上海东方卫视黄金档2017年CSM52城收视率与酷云Eye直播关注度相关性分析
目前大陆收视率统计主要以央视索福瑞为准,新兴起的酷云实时关注度仅作为参考,二者样本覆盖方式不同、统计方式不同,但都从各自的角度一定程度上反映了在播节目的收视情况。本文以东方卫视2017年黄金档播出节目为例,对酷云和CSM52城收视进行描述性统计和相关性分析,探索二者之间关联。
一、背景介绍
(一)收视率是什么?
电视收视率是指某一时段内收看某电视频道(或某电视节目)的人数(或家户数)占电视观众总人数(或家户数)的百分比。
(二)为什么需要收视率?
绝大部分的电视台都是靠卖广告时间来获取收入的。一个电视台的收视率高就代表关注这个电视台的人就越多,其广告效益就更好。因此电视台的收视率其实就是他们的收取广告费的筹码,收视率高更能吸引好的广告,收视率高其广告时间更好卖。对于广告投放商,将广告投在哪个平台、什么时段、投放效果如何,如何预判投放策略,也都跟收视率息息相关。这些都使得收视率统计和呈现成为了必需,可以说收视率就是应广告主们为知晓花钱值不值而诞生的。
(三)收视率统计现状
虽然收视率本身只是一个简单的数字,但是这个数字的背后其实是一系列科学的基础研究、抽样和建立固定样组、测量、统计和数据处理的复杂过程。因此收视率的统计都是由专业的市场调查公司完成。大陆范围曾经有两家并存的收视率调查公司,AC尼尔森和央视-索福瑞,但由于尼尔森被兼并等原因退出大陆市场,央视-索福瑞一家独大,在本文中采用公认的CSM52城收视做分析。
但是一家独大的数据公司索福瑞经常因为各种问题被业内人诟病:诸如不信任它全国6.1万的样本户,不信任它的取样模式,再加上其自身存在“盈利”行为等等。
近年来,随着智能电视机和机顶盒的推广,以及大数据概念被应用,酷云eye(以下简称:酷云)实时直播关注度也越来越多的被关注,同时尼尔森回归大陆市场,也被作为广告投放的参考项之一。
二、研究目的
作为反映收视情况的指标,CSM52城收视和酷云各有利弊。
CSM52城收视是根据严谨的统计学抽样手段推及总体,具有科学性,但同时过度依赖样本户,一旦样本户被污染,收视数据就也会被污染。
酷云数据来自于覆盖终端的实时回传,减少了样本被污染的可能性,但酷云覆盖样本并不是依据统计学原理抽样获得,无法囊括到所有索福瑞的样本户,是否能代表总体有待考证,也因此酷云的数据目前仅作为参考,而并没有被广泛认可。
通过对酷云数据和CSM52城收视数据长时间跟踪记录,初步发现同一平台播出的同一部电视剧,CSM52城收视与酷云的比值,本文称之为系数,系数基本围绕某个水平上下波动;同一平台播出的不同剧,系数差异稍大,但也基本稳定在一个范围,不会超出过多;不同平台系数水平有较明显差异;当酷云大幅度增长时,基本可以推断收视也是上涨趋势。
因此,我们尝试用统计学原理对过去1年的数据进行统计分析,以探讨CSM52城收视率与酷云数据是否存在相关性,系数是否稳定在一个固定区间,以及是否能够根据历史数据做出预测。
以东方卫视黄金档为例,摘取了2017年全年播出电视剧的酷云、CSM52城收视率数据,旨在分析东方卫视2017年收视情况及酷云与CSM52城收视是否存在相关性。
三、研究内容
(一)概况
上海东方卫视2017年黄金档共播出电视剧15部,其中风筝跨2017-2018年播出,因此统计时间段为2017年1月1日-2018年1月11日共379天,其中有12天未播出电视剧,因此样本量为367组数据。
播出电视剧基本信息见表1,文中为绘图方便,对电视剧按播出顺序进行了编号。其中现代背景都市题材作品9部、革命题材3部、公安题材1部、古装仙侠1部、年代戏1部。10部剧平均收视过1,最高达2.564,平均收视过1的电视剧中有7部是现代都市题材,可见东方卫视播出现代都市题材的作品收视情况较好。
表1 2017年上海东方卫视黄金档播出电视剧
电视剧名称 | 电视剧代码 | 集数 | 类型 | 平均收视率 |
守护丽人 | DF-01 | 47 | 都市情感 | 1.229 |
三生三世十里桃花 | DF-02 | 58 | 古装仙侠 | 1.288 |
黎明决战 | DF-03 | 31 | 公安年代 | 0.802 |
剃刀边缘 | DF-04 | 48 | 革命谍战 | 0.946 |
继承人 | DF-05 | 44 | 都市情感 | 0.679 |
欢乐颂2 | DF-06 | 55 | 都市情感 | 1.585 |
一粒红尘 | DF-07 | 38 | 都市情感 | 0.837 |
我的前半生 | DF-08 | 42 | 都市情感 | 1.876 |
绝密543 | DF-09 | 34 | 革命战争 | 0.628 |
守卫者浮出水面 | DF-10 | 30 | 都市谍战 | 1.066 |
那年花开月正圆 | DF-11 | 74 | 年代情感 | 2.564 |
国民大生活 | DF-12 | 40 | 都市情感 | 1.059 |
急诊科医生 | DF-13 | 43 | 都市情感 | 1.248 |
生逢灿烂的日子 | DF-14 | 47 | 都市情感 | 1.238 |
风筝 | DF-15 | 46 | 革命谍战 | 1.181 |
(二)相关分析
以播出日期为横坐标,CSM52城收视及酷云数据为纵坐标,绘制收视走势,见图1。每播出一部新剧,收视率会发生回落,回落幅度随剧的不同而有差异。每部剧从开播收视基本呈现上升趋势,上升速度视剧的不同而有所不同。总体来看,2017年东方卫视黄金档播出的15部剧,收视曲线均较为理想,没有出现从播出一直下滑的现象。其中DF-02、DF-08、DF-11增幅明显。
图1中上方曲线是CSM52城年度走势,下方是酷云直播关注度年度走势,虽然随着播出电视剧不同,具体数据大小有所波动,但可以看出二者走势基本一致,初步推断它们之间可能存在相关关系。图1 2017年1月1日-2018年1月11日东方卫视电视剧收视走势
图2 CSM52城-酷云直播关注度散点图
以酷云直播关注度为x轴,CSM52城收视率为y轴绘制散点图,见图2,紧密围绕在一条直线周围,印证了存在相关关系的推断。拟合方程为y = 0.81x + 0.3032,R2 = 0.8593,虽然呈现线性关系,但拟合情况并不是很好。为了在统计学上精确判定是否存在相关关系,我们将数据导入SPSS做双变量相关分析,输出结果见表2,相关系数为0.927,显示二者呈强相关性。
表2 CSM52城-酷云直播关注度双变量相关分析
(三)CSM52城收视/酷云预测
通过前边的计算验证了CSM52城收视和酷云数据间存在强相关性,那么是否可以根据酷云数据来对CSM52城收视做推断呢?由图2可知,尽管二者近似存在线性关系,但随着酷云数值的增大,相关关系在减弱。同时由于每部剧播出周期不同,收视随着每部剧的播出呈现由低到高的周期性增长,且周期呈现无规律性。因此整体性的线性规律应用到具体每一部剧仍然有偏差。但是通过前期的观察,我们发现系数=CSM52城收视/酷云呈现围绕某一特定值或区间波动的趋势。同时由于引入比值的概念,使得无论播出的剧周期如何、具体收视数值如何,都能在同一维度下进行分析。那么系数分布是否有特定的规律呢?系数的值/区间是否可预测呢?
我们对每一组数据求得相应的系数值,借助SPSS统计工具对系数进行描述性统计,样本量n=367,结果如下:
绘制直方图,见图3,系数呈现近似正态分布趋势;绘制Q-Q图,进一步验证是否服从正态分布,见图4::
图3 系数(CSM52城/酷云)分布直方图 图4 系数(CSM52城/酷云)Q-Q图
Q-Q图中各点近似围绕着直线,说明系数的分布服从正态分布。
表3 系数(CSM52城/酷云)描述性统计
SPSS计算结果显示:K-S和S-W的sig均>0.05,可以认为系数服从正态分布,其估计值为1.1460,置信区间为[1.1220,1.1700]。所以我们有95%把握认为东方卫视CSM52城收视与酷云直播关注度比值,即系数期望值在1.1220~1.1700之间。
(四)实际应用
尽管我们通过统计学方法和SPSS软件辅助,计算出了系数的估计值和置信区间,但在实际应用中我们却不能单纯的用酷云乘以这个系数期望值直接估算出准确的CSM52城收视率。原因在于酷云覆盖样本户和索福瑞覆盖样本户的偏差,导致对于同一部剧,系数可能稳定在一个范围,但不同剧之间可能会有较大差异,比如2017年系数最低值为0.6070,最高值为2.0278,均与期望值相差甚远。
但是这并不意味着系数没有任何意义,由于系数服从正态分布,因此我们可以计算出随机变量系数落入均值左右各2个标准差的概率是95.45%,落入其左右各3个标准差内的概率是99.73%。代入到2017年数据换算可得:
μ=1.1460 ,σ=0.23391
即系数在[0.6782,1.6138]的概率为95.45%,系数在[0.4443,1.8477]的概率为99.73%。由此,可用以判断CSM52城收视率的可靠性。
四、结论与总结
(一)东方卫视2017年黄金档电视剧,都市剧势头强劲;
(二)东方卫视2017年黄金档CSM52城收视率与酷云直播关注度直接存在强相关关系;
(三)随着收视率增高,CSM52城收视率与酷云直播关注度的相关性减弱;
系数=CSM52城收视/酷云呈现正态分布,μ=1.1460 ,σ=0.23391,置信度95%的置信区间为[1.1220,1.1700];
(四)以本文中数据为例,系数在[0.6782,1.6138]的概率为95.45%,系数在[0.4443,1.8477]的概率为99.73%,系数不在以上范围的,为异常值,当日CSM52城收视率数据真实性待考证。
从电视台的角度看,其收入很大一部分来源于广告商投放广告,收视率高才有可能卖高价;从广告商的角度看,投放的广告是否达到预期目标、投放哪个平台哪个时间段更有效也要依赖收视率,因此收视率的地位至关重要。从期望来讲无论是广告商、电视台还是制作方,毫无疑问都是希望能够取得高收视率的,但观众的口味总是无法预测,导致有些时候播出效果不尽如人意,收视率造假应运而生。由于CSM52城数据由样本推及总体,只要在高权重城市污染少量样本户,就可以将收视率提高一个台阶,导致近年来CSM收视率的权威性也一直面临质疑和挑战,但就现状来讲,CSM的地位仍然是无法撼动的。而对于广告商和播放平台,总要知道一个真实的收视情况,尽量剥离干扰和水分,以便为以后的购剧及投资做参考。酷云一直以来由于覆盖样本不全面等问题不被认可,但经过对历史数据的统计分析,酷云数据与CSM52城收视的相关关系得到了验证并求出合理区间,我们便可以通过系数来反观CSM52城收视的可信度。
本文来源:《视听》:http://www.zzqklm.com/w/qk/9501.html