综投网-分享投资理财知识网站 加入收藏

投资理财

首页 > 投资频道 > 正文

今年双十一成交额多少?2020双十一成交额预测

本站整理 2020-11-10 23:12

  2019年双11过去以后,阿里报告了天猫双十一的全天销售额:2684亿。这个数字引发了一场关于统计学的有趣争执。

今年双十一成交额多少

  一位叫“尹立庆”的微博网友,在2019年4月24日发了一个贴,通过拟合2009-2018年的双11天猫数据,由于拟合度高达99.94%,他认为淘宝是在按公式假造成交数据。并且他还“预测”,天猫2019年双11成交额为2675.37亿(二次拟合)或者2689亿(三次拟合)。最终出来的数据是2684亿,与他预测的2689亿非常接近。

  这个“精准”的提前预测引发了不少人的关注,很多人确实相信淘宝是在凑成交额,不然怎么可能这么准?

  很多人翻出了这个“神预测”,暗示“阿里数字造假被抓现行”。这引发了一场风波,许多人在传,阿里双11销售数字造假。尹立庆在微博上的原贴已经被删除,但是网上截图还是很多。

  天猫的公关负责人也发了声明,驳斥了造假的说法。

  12日晚间,天猫再度发文回应称,“今早到现在,这则精心图文化设计的‘预测’开始被刻意传播”、“已就这则谣言启动司法流程”。估计尹立庆删微博是觉得不太对了。但是个人感觉天猫没有从数学上解释这些疑问。

  到底阿里有没有对双11天猫成交数据造假?如果没有造假,为什么统计拟合如此精准,尹立庆提前半年的预测又如此准确?我们来介绍一下相关的知识。

  首先说一下,这个预测涉及的“二次拟合”或者“三次拟合”不需要手算,其实是Excel等数据表格软件的功能。所以,不需要进行高深的数学推理和计算,会用Excel简单地制表就行了。

  首先是数据源,这个是有公开数据的,没有争议:

  然后,对这两列数据制一个散点图表:

  然后是二次和三次多项式拟合曲线。

  尹立庆的关键预测是下面这张图:

  以上这几个图都是引自尹立庆发的文章。我们要解释一下,预测里的二次、三次多项式拟合,以及R-squared是什么意思。不用急着去了解概念,看下面的操作流程自然就明白了。

  我自己用Excel可以复制这个二次拟合,截图如下:

  这个就是将年份与成交额两列数据,做成一个散点图表。然后鼠标点在一个数据点上,就会出来一个“趋势线”的选项。再把趋势线选择成“多项式”,选2次多项式。再让图表上显示公式、R平方值,左边的曲线拟合图就自动出来了。

  其实用国产免费软件WPS里面的表格,也一样可以做出这种趋势线的方程。为支持国产软件,我们用WPS来做。不难摸索出用WPS如何生成趋势线和方程。

  上图是WPS生成的2009-2019年11年的成交额数据的拟合曲线,可以看出,WPS和Excel生成的二次拟合方程参数是一样的。

  得出的拟合方程是一个二次的多项式:

  y= 30.237xx - 121529x + 1E+08,R平方 = 0.9996这个R平方就是“可决系数”,越接近1越好,有一个公式来计算的,后面会解释。公式里的1E+08是科学计数法写的常数项,数值太大了写不下,是一个数字。看样子曲线拟合得很好,但是为什么常数项都大到出不来了?哈哈,因为这个软件,把2009-2019当做数值,也就是说x的取值是2009到2019。它不知道是年份,也把这个拟合做出来了。

  我们弄聪明点,把年份用0-10代表,2009就是第0年,2019就是第10年,同样把图表和拟合方程做出来。用0开始的好处,是可以直接得到拟合的初值,其实用1-11也差不多。

  这个方程就好多了:

  y= 30.237xx - 35.064x + 7.3632,R平方 = 0.9996我们把x = 10代进去算,得到的是:

  30.237* 10 * 10 - 35.064 * 10 + 7.3632 = 2680.423这个数值相当接近2019年天猫的实际成交额2684亿。画在图上这么点差距根本看不出来,点的中心就在趋势线上。看上去拟合得非常好,简直太漂亮了,天猫这11年怎么可能成交得这么准呢?

  到此我们可以看出来,所谓的“二次多项式拟合”,就是用一个方程:

  Y =A * xx + B * x + C

  去拟合一系列x值对应的原始y值,误差越小越好,“拟合度”越接近1越好。这个拟合度,就是用“R平方”来代表的。

标签:双十一

用户评论(已有0条评论)

昵称:
表情
发表评论
注:您的评论需要经过审核才能显示哦,请文明发言!
最新评论
暂无评论

7*24小时快讯