About云-梭伦科技»专题 › 交流区 › 技术交流 › Spark › spark用java编程序DataFrame包找不到，奇怪了

spark用java编程序DataFrame包找不到，奇怪了

查看数: 9261 | 评论数: 3 | 收藏 0

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

一颗银杏树

发布时间: 2017-6-26 17:58

正文摘要:

本帖最后由一颗银杏树于 2017-6-26 18:03 编辑正常情况下DataFrame类应该在这个包下：org.apache.spark.sql.DataFrame ，在eclipse中写java发现此包中没有DataFrame类。这种情况谁见 ...

一颗银杏树 发表于 2017-6-26 20:16:31

muyannian 发表于 2017-6-26 18:27
这些都是编译后的文件，不一定非得跟Scala是一样的。
看到楼主已经有spark sql包了，在开发环境中，加入
...

eclipse中import后没有找到DataFrame，然后我查看maven依赖中的sql包确实是有的，但这个包里没看到DadaFrame这个类啊

muyannian 发表于 2017-6-26 18:28:33

下面是关于mysql，可以写成关于文件等
[mw_shl_code=java,true]package com.hjh.demo.mysql;


import java.util.Properties;


import org.apache.log4j.Logger;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.SQLContext;
import org.apache.spark.sql.SaveMode;


public class Demo_Mysql3 {


private static Logger logger = Logger.getLogger(Demo_Mysql2.class);


public static void main(String[] args) {


SparkConf sparkConf = new SparkConf();


sparkConf.setAppName("Demo_Mysql2");
sparkConf.setMaster("local[5]");
JavaSparkContext sc = null;
try {
sc = new JavaSparkContext(sparkConf);


SQLContext sqlContext = new SQLContext(sc);


// 一个条件表示一个分区
String[] predicates = new String[] {
"1=1 order by id limit 400000,50000",
"1=1 order by id limit 450000,50000",
"1=1 order by id limit 500000,50000",
"1=1 order by id limit 550000,50000",
"1=1 order by id limit 600000,50000" };


String url = "jdbc:mysql://localhost:3306/mysql";
String table = "demo3";
Properties connectionProperties = new Properties();
connectionProperties.setProperty("dbtable", table);// 设置表
connectionProperties.setProperty("user", "root");// 设置用户名
connectionProperties.setProperty("password", "root");// 设置密码


// 读取数据
DataFrame jdbcDF = sqlContext.read().jdbc(url, table, predicates,
connectionProperties);


jdbcDF.printSchema();


// 写入数据
String url2 = "jdbc:mysql://localhost:3306/mysql";
Properties connectionProperties2 = new Properties();
connectionProperties2.setProperty("user", "root");// 设置用户名
connectionProperties2.setProperty("password", "root");// 设置密码
String table2 = "demo4";


// SaveMode.Append表示添加的模式


// SaveMode.Append:在数据源后添加；
// SaveMode.Overwrite:如果如果数据源已经存在记录，则覆盖；
// SaveMode.ErrorIfExists:如果如果数据源已经存在记录，则包异常；
// SaveMode.Ignore:如果如果数据源已经存在记录，则忽略；


jdbcDF.write().mode(SaveMode.Append)
.jdbc(url2, table2, connectionProperties2);
} catch (Exception e) {
logger.error("|main|exception error", e);
} finally {
if (sc != null) {
sc.stop();
}


}


}
}  [/mw_shl_code]

muyannian 发表于 2017-6-26 18:27:30

这些都是编译后的文件，不一定非得跟Scala是一样的。
看到楼主已经有spark sql包了，在开发环境中，加入
import org.apache.spark.sql.DataFrame;
然后操作关于DataFrame的内容，看能否成功

图文精华

spark用java编程序DataFrame包找不到，奇怪了

正文摘要:

回复

推荐 /2