我的需求是:
取出DataFrame中的某行某列的位置上的数据。
[mw_shl_code=java,true]JavaSparkContext sc = new JavaSparkContext("local", "dataAnalysis");
SQLContext sqlContext = new SQLContext(sc);
HashMap<String, String> options = new HashMap<String, String>();
options.put("header", "true");
options.put("delimiter", ",");
options.put("path", "/dataAnalysis/inputData/67.csv");
DataFrame initialData = sqlContext.load("com.databricks.spark.csv",options);
Double value = initialData.filter("NO==行号").select("列名").head().getDouble(0);
[/mw_shl_code]
通过以上的方法是可以获取到某行某列位置上的数据。但是如果我的DataFrame对象做了过滤操作,或者重新排序操作以后。生成的新的DataFrame中NO字段的值会不连续。
我想请问大神们我该如何在在DataFrame被过滤或者重拍后生成的新DataFrame中获取某行某列的数据值。
|
|