楼主尝试下面:
每一个SparkContext发布一个web界面,默认端口是4040,它显示了应用程序的有用信息。这包括:
Ø 一系列的调度阶段和任务
Ø 对于RDD大小和内存使用的总结
Ø 环境信息
Ø 运行的执行器(executor)的信息
你可以通过浏览器访问http://<driver-node>:4040,当然,你必去先启动SparkContext。比如命令:./bin/spark-shell,出现下面的web界面信息:
如果某台机器上运行多个SparkContext,它的web端口会自动连续加一,比如4041,4042,4043等。为了浏览持久的事件日志,设置park.eventLog.enabled就可以了。
|