综投网-分享投资理财知识网站 加入收藏

投资理财

首页 > 投资频道 > 正文

今年双十一成交额多少?2020双十一成交额预测

本站整理 2020-11-10 23:12

  我们再把R平方的定义解释一下,

  R平方 = 1 - SSE/SSTSSE就是和方差,每个点的拟合值与实际值有一个误差,对它平方,所有点的误差平方加起来,就是SSE。然后所有点原始y值,和平均值有一个差值,对这个差值平方,所有点的差值平方相加,就得到了SST,是个挺大的数。看不懂没关系,我们用下面的表格来解释。

  第一列年份0-10就是公式里的x值,分别对应2009-2019年。第二列就是实际的y值,是每年新闻报出的天猫成交额。这些实际成交值,有一个平均值890.35。拟合值,就是用公式“y = 30.237xx - 35.064x + 7.3632”算出来的每一年的值。误差,就是用“实际成交值”减去拟合的值。

  这个表是与上个图并排的,分开来看得清楚一些。误差平方就是对前面得到的误差值进行平方。所有的误差平方相加,就是误差平方和SSE,等于3183.18。

  每一年的实际成交值,和平均值890.35求出一个差异。然后对每个值平方,再求和。得到了“均值差平方和”SST,数值很大是8647639.7。

  然后就可以得到“可决系数”R平方,是 1 - 3183.18/8647639.7 = 0.9996。这个值就正好和WPS生成的R平方值相等。

  看这个表格,我们就忽然发现,这个拟合的“神奇感”好象下降了。你看第一年0.5的值,拟合值7.3632却是它的十多倍。第二年的拟合值2.5362,甚至不到第一年拟合值的一半。如果第二年业绩是这个鬼样,马云得把天猫负责人就地撤职。但是画成图,因为绝对坐标的关系,早期很大的拟合误差,与以后很大的成交值相比显得很小,画出来显得拟合得很好。

  我们发现,越是早期的小数据,误差相对越大。定义一个误差率,是误差值除以原值乘以100%。头四年的误差离谱地大,高的有1372%和72.9%,第四年差异仍然高达8.74%。后面随着原值的逐渐地大,误差率就逐渐减小,只有0.2%、0.1%了。

  也就是说,这个拟合的“秘诀”是:注意把每个点的误差的绝对值弄得小一些,顾头不顾腚,顾大不顾小。最后画出图来,因为坐标要跟比较大的数值的尺度,前面较大的相对误差就缩起来看不见了。

  另一点要注意的,不要迷信那个R平方值,以为多么接近1啊,真神奇啊。例如上图,假设2019年天猫成交额不是2684亿,而是跑到一个很歪的3000亿去了。那么我们新做一个二次多项式拟合,得出的R平方值仍然有0.9952,还是相当接近1。从图上看出来,后面两个点已经有点偏了,R平方值仍然漂亮得很。这是因为这个R平方值,分母SST是个特别大的数,怎么算最后总是接近于1。

  尹立庆的预测巧合在于,他对2019年的预测正好碰上这年天猫的增长是中规中矩的25.7%。二次多项式拟合的预测值2675,预期增长是25.3%,正好相差不大。天猫2019年成交增长25%,这个并不奇怪,不少人随口说个直觉也可能是这个数。

  但并不是每一年都如此,其实天猫的增长率也出过异常。

  看上图天猫历年的增长率,前面增长率高,后面增长率逐渐下滑,因为规模大了增长率下跌正常。但是2017年增长了39%,高于2016年的32%,这是一个数据异常。

  假设我们在2016年,看到8年的成交数据,搞了一个二次拟合,结果会是如何?

  我们用8个点,同样得到了一个相当漂亮的拟合曲线!R平方值也是0.9985,相当接近于1。方程是:

  y= 28.571xx - 25.295x + 0.1558如果用这个二次多项式方程,去算2017年的值,会是:

  y= 28.571*8*8- 25.295*8 + 0.1558 = 1626.34

  2017年的实际成交额是1682亿,差了50多亿,就没有2019年只差几亿那么神了。

  有趣的是,这个公式对2017年的预测增长率是34.74%,也高于上年的32.35%。这是因为,2014、2015、2016三年的增长率分别是63%、59%、32%。这个32%降得有点多,在下一年就补回来一些。比如天猫管理团队认为,2016年增长率不尽如人意,要多想招,2017年的增长率就搞到了39.35%,发力过度,比拟合预测的还要高了。

  让我们来看8个点和11点得到的两个二次多项式拟合方程:

  2009-2016:y = 28.571xx -25.295x + 0.15582009-2019:y = 30.237xx -35.064x + 7.3632注意,这两个方程对应的三个系数,差异已经非常大了。就算马云有一个“按公式操纵天猫每年双11成交额”的邪恶计划,我们也搞不清楚他最初设计的二次方程系数是如何的。

  所以,要么马云没有操纵天猫双11成交额的数学方程,要么马云在动态修正预测成交的方程。不太可能在某年就把这些系数定死了。

  其实,马云在动态修正预测成交的方程,这个倒是接近真相了。本来做生意就是这样的,上一年增长够高了,下一年的增长任务就轻一点,以免各种配套跟不上;上一年增长觉得低了,下一年就多努力做高,免得业绩增长不好看。但是都动态上了,本就无可厚非,是人家在搞数值化管理,谁管得着?

  等数值都出来了,再去回头把二次多项式的系数拟合出来,我们可以发现,很容易就拟合得不错,而且R平方相关系数可以做得很漂亮。前提条件是,这一系列数据增长率要比较大,前期的数据比较小,后期的数值大,就可以仅用二次多项式做出一个漂亮曲线了。

  如果增长率变动有点大,那就要用三次、四次多项式了。但原理是一样的,就不再分析了。

  总之,不要相信拟合的神奇,也不要相信“拟合度”接近1的神奇效果。这个在数学统计里,实在很平常。对搞过数据分析的人来说,这是最平常的手段,迷信拟合真是少见多怪,只会被内行笑掉大牙。

  这还只是二次多项式三个系数的拟合。要是用深度学习那上百万个系数来拟合,结果可以漂亮得让一些传统研发人员怀疑人生,转而去搞机器学习。

标签:双十一

用户评论(已有0条评论)

昵称:
表情
发表评论
注:您的评论需要经过审核才能显示哦,请文明发言!
最新评论
暂无评论

7*24小时快讯