liwenshui 2019-09-27
时间序列是一种标准的分析方法,但是较为先进的机器学习工具引入了统计技术,来建立更精确的预测模型。时间是无法倒流的,但是使用现有的工具,您有更多的机会预测时间,更准确地说,是可以预测时间序列样本中的事件是否会继续影响决策趋势。
Google发行的Facebook Prophet和TensorFlow是两种旨在吸引开发人员创建数据科学应用程序的机器学习协议。技术和分析经理应将这些工具视为扩展其DataOps功能并将其初始步骤扩展到机器学习的方法。
由Facebook核心数据科学团队创建的Facebook Prophet提供了可靠的时间序列预测,其中处理能力是一个问题。先知基于加性模型,以解决非线性趋势如何与每年、每周和每天的季节性相适应。当数据包含周期性趋势(例如发现突发事件影响趋势)时,该框架将为企业提供帮助。 R编程和Python版本是在一年前发布的,因此企业可以利用开源资源来创建模型。 源代码和示例可在GitHub上获得。
神经网络框架还提供了一套附加的概率模型,在R中,模型被称为一个单独的库。这使得更高级的统计模型可以更容易地构建到模型中。在时间序列的情况下,用户可以应用贝叶斯结构的时间序列。贝叶斯结构时间序列是一组概率模型,它包含并延展了许多标准的时间序列建模概念。其目的是突出统计细节,以便更准确地比较当前和以往各时期的时间序列数据。TensorFlow概率库允许模型包含贝叶斯结构时间序列。
为什么要对时间序列如此重视呢?时间序列报告和Excel电子表格一样常见,许多工具都显示时间序列数据,而你只需看一下web分析解决方案或社交媒体分析报告就可以得到。但是,这些解决方案中时间序列数据的可视化并没有真正考虑到统计分析。
例如Google Analytics(分析)之类的网络分析解决方案,可以提供引荐流量的时间序列结果,这些结果可以决定哪些源始终向网站发送流量。但是,假设您需要预测给定转诊源的趋势可以持续多久,如果时间足够长,趋势线的斜率可能无法立即从平面线中分辨出来。通常确定第一个客户的搜索流量的最高转换来源时会耗费较长时间,因为访问量增长缓慢。
根据目前的数据源情况,给定时间序列的频率模式也可能不是线性的。这意味着观测结果将以对数或曲线的形式显示出连续的增减。具有统计能力的工具能够比标准解决方案更好地检测这些细微差别的趋势。进行股票市场预测的金融专业人士非常了解更好的统计能力的价值。他们使用先进的工具来创建精确的时间序列预测,但因为数据中的噪音和波动掩盖了这一趋势。