分享

Spark 高级分析:第九章第3,4节 模型介绍和获取数据

本帖最后由 feilong 于 2018-11-2 18:51 编辑

问题导读

1.
什么是蒙特卡洛风险模型
2.模型公式是什么?

3.文中从哪里获取股票数据



关注最新经典文章,欢迎关注公众号



Spark 高级分析:第九章第1,2节 计算VaR的方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26219


蒙特卡洛风险模型通常用一组市场因素来描述每个票据的回报。普通市场因素可能是标准普尔500指数、美国GDP或货币汇率等指数的价值。因此,我们需要一个模型,根据这些市场条件预测每个票据的回报。在我们的模拟中,我们将使用一个简单的线性模型。根据我们上面的回报定义,要素回报是市场要素价值在特定时间上的变化,例如,如果标准普尔500的价值在一段时间内从2000移动到2100,那么它的回报将是100。我们将从因子返回的简单变换导出一组特征。即,试验t的市场因素向量mt被某个函数变换以产生可能具有不同长度ft的特征向量。
图片1.png
对于每个票据,我们将训练一个模型,给每个特征分配一个权重。为了计算rit,在试验t中票据i的回报,我们使用ci,票据的截取项,wij,票据i中特征j的回归权重,以及试验t中特征j的随机生成值:
图片2.png
这意味着,每种票据的回报率是市场因素特征乘以该票据的权重的回报之和。我们可以使用历史数据(也称为线性回归)拟合每个票据的线性模型。如果VaR计算的范围是两周,则回归将历史上每隔(重叠)两周的时间间隔当作标记点。

值得一提的是,我们可以选择一个更复杂的模型。例如,模型不需要是线性的:它可以是回归树或者明确地包含领域特定知识。

现在我们有了从市场因素计算票据损失的模型,我们需要一个模拟市场因素行为的过程。一个简单的假设是每个市场因素回报遵循正态分布。为了捕捉市场因素常常是相互关联的事实——当纳斯达克下跌时,道琼斯指数可能也遭受损失——我们可以使用具有非对角协方差矩阵的多变量正态分布。
图片3.png
其中μ是因子收益的经验均值的向量,是因子收益的经验协方差矩阵。

如上所述,我们可以选择更复杂的方法来模拟市场,或者为每个市场因素假设不同类型的分布,也许使用尾部较胖的分布。

很难找到大量格式良好的历史价格数据,但雅虎有各种可用的CSV格式下载的股票数据。下面的脚本位于回购的风险数据目录中,它将进行一系列REST调用,以便下载NASDAQ索引中包括的所有股票的历史记录,并将它们放置在stocks/目录中。
[mw_shl_code=bash,true]$ ./download-all-symbols.sh[/mw_shl_code]
我们还需要我们的风险因素的历史数据。对于我们的因素,我们将使用标准普尔500指数和纳斯达克指数的值,以及30年期国债和原油的价格。这些索引也可以从雅虎下载:
[mw_shl_code=bash,true]$ mkdir factors/
$ ./download-symbol.sh SNP factors
$ ./download-symbol.sh NDX factors[/mw_shl_code]
美国国债和原油必须从投资网站复制/粘贴。




已有(2)人评论

跳转到指定楼层
jiangzi 发表于 2018-11-3 18:19:02
蒙特卡洛风险模型~~~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条