搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据学习
›
Spark
›
连载型
›
Spark 高级分析:第九章第3,4节 模型介绍和获取数据
0
2
0
分享
Spark 高级分析:第九章第3,4节 模型介绍和获取数据
feilong
2018-11-2 09:00:11
发表于
连载型
[显示全部楼层]
只看大图
阅读模式
关闭右栏
2
4507
本帖最后由 feilong 于 2018-11-2 18:51 编辑
问题导读
1.
什么是蒙特卡洛风险模型
?
2.模型公式是什么?
3.文中从哪里获取股票数据
?
关注最新经典文章,欢迎关注公众号
Spark 高级分析:第九章第1,2节 计算VaR的方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=26219
蒙特卡洛风险模型通常用一组市场因素来描述每个票据的回报。普通市场因素可能是标准普尔500
指数、美国GDP或货币汇率等指数的价值。因此,我们需要一个模型,根据这些市场条件预测每个票据的回报。在我们的模拟中,我们将使用一个简单的线性模型。根据我们上面的回报定义,要素回报是市场要素价值在特定时间上的变化,例如,如果标准普尔500的价值在一段时间内从2000移动到2100,那么它的回报将是100。我们将从因子返回的简单变换导出一组特征。即,试验t的市场因素向量m
t被某个函数变换以产生可能具有不同长度ft的特征向量。
对于每个票据,我们将训练一个模型,给每个特征分配一个权重。为了计算rit,在试验t中票据i的回报,我们使用ci,票据的截取项,wij,票据i中特征j的回归权重,以及试验t中特征j的随机生成值:
这意味着,每种票据的回报率是市场因素特征乘以该票据的权重的回报之和。我们可以使用历史数据(也称为线性回归)拟合每个票据的线性模型。如果VaR计算的范围是两周,则回归将历史上每隔(重叠)两周的时间间隔当作标记点。
值得一提的是,我们可以选择一个更复杂的模型。例如,模型不需要是线性的:它可以是回归树或者明确地包含领域特定知识。
现在我们有了从市场因素计算票据损失的模型,我们需要一个模拟市场因素行为的过程。一个简单的假设是每个市场因素回报遵循正态分布。为了捕捉市场因素常常是相互关联的事实——当纳斯达克下跌时,道琼斯指数可能也遭受损失——我们可以使用具有非对角协方差矩阵的多变量正态分布。
其中μ是因子收益的经验均值的向量,是因子收益的经验协方差矩阵。
如上所述,我们可以选择更复杂的方法来模拟市场,或者为每个市场因素假设不同类型的分布,也许使用尾部较胖的分布。
很难找到大量格式良好的历史价格数据,但雅虎有各种可用的CSV格式下载的股票数据。下面的脚本位于回购的风险数据目录中,它将进行一系列REST调用,以便下载NASDAQ索引中包括的所有股票的历史记录,并将它们放置在stocks/目录中。
[mw_shl_code=bash,true]$ ./download-all-symbols.sh[/mw_shl_code]
我们还需要我们的风险因素的历史数据。对于我们的因素,我们将使用标准普尔500指数和纳斯达克指数的值,以及30年期国债和原油的价格。这些索引也可以从雅虎下载:
[mw_shl_code=bash,true]$ mkdir factors/
$ ./download-symbol.sh SNP factors
$ ./download-symbol.sh NDX factors[/mw_shl_code]
美国国债和原油必须从投资网站复制/粘贴。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(2)人评论
电梯直达
正序浏览
jiewuzhe02
发表于 2018-11-3 10:49:41
分享分享
回复
使用道具
举报
显身卡
jiangzi
发表于 2018-11-3 18:19:02
蒙特卡洛风险模型~~~
回复
使用道具
举报
显身卡
还有一些帖子被系统自动隐藏,点此展开
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
feilong
版主
关注
101
主题
149
帖子
22
粉丝
TA的主题
Spark 高级分析:第十三章附录:即将推出的MLLIB管道API
2019-3-15
Spark 高级分析:第十二章第4-6节 Spark和数据科学家的工作流程
2019-3-8
Spark 高级分析:第十二章第1-3节 深入Spark
2019-2-22
Spark 高级分析:第十一章第3节 用Thunder对神经元类型进行分类
2019-2-15
Spark 高级分析:第十一章第2节用Thunder加载数据
2019-1-25
24小时热文
像高手一样发言:七种常见工作场景的说话之
幕后产品:打造突破式产品思维
副业警钟,新型法律碰瓷发财方式:批量诉讼
Spark机器学习
Spark机器学习算法、源码及实战详解
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈