用户组:游客
问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? ...
我只有一个master和一个slavehbase.zookeeper.quorum怎么配置?配置zookeeper集群我看文档,要求这个参数必须是奇书,我只有一个 ...
谁知道hdp源码在哪里下载,谢谢!签到。。。。
【2015年6月19日】 刚接触Hadoop两个月,因为公司要用,所以现学的,看的文章比较杂,尤其是1.x和2.x的混着看,越看越理不清头 ...
2013-10-14 18:02:37,237 INFO org.apache.hadoop.mapred.TaskTracker: attempt_201310122012_0637_r_000000_0 0.16666667% redu ...
在基于用户推荐中 recommend 第一参数用户为long型, 而我数据库中地用户id是字符型 有其他方法吗?要自己写转换程序吗 ...
最近,很多小伙伴问我,如何才能自学成为 Python 高手?根据自己多年大厂工作经验和带领数千朋友的学习,信盈达小编总结了几点小 ...
大部分的新人、毕业生或者想转行的人群,所以他们面临的第一个迷茫就是选择入门的途径问题。现在冬天,又是养精蓄锐的季节,工作 ...
太阳能电池片颜色深浅不一,需要按颜色进行分档分类,在只有极少量标签的情况下,只能使用深度学习中的无监督或半监督来完成,目 ...
自己做了一个很小的日志分析项目,面试问到以下问题,个人回答老露馅,没有经验,不知道怎么回答,求指导 ...
数据治理是当今快速发展和高度竞争的企业环境中的一项要求。现在,组织有机会捕获大量不同的内部和外部数据,他们需要一个规 ...
问题描述:datanode web服务器状态告警,分析日志没明显报错,那位大佬给下思路啊 Service Monitor日志查看有延迟情况: ...
docker 使用mysql8镜像时加载指定的外部配置文件和存储目录,报出 mysqld: Error on realpath() on '/var/lib/mysql-files' ...
kafka版本:0.9 CDH版本:5.12.2 问题描述: 一个java写的通过zookeeper链接消费kafka的程序挂掉了,报错“error during sy ...
来来来,讨论个问题,10TB的数据,每条数据有200个字段,要对这些字段进行即席查询,也就是用户自己选上字段自定义条件进行查询 ...
es和solrcloud都是基于lucene的全文搜索引擎。其中solrcloud是借助于zookeeper这个分布式协调系统来实现集群中各个机器通信的。 ...
[mw_shl_code=scala,true]tableEnv.connect(new Kafka() .version("universal") ...
[mw_shl_code=xml,true] org.apache.flink flink-connector-kafka_2.11 1.10.0 [/mw_shl_code] ...
[mw_shl_code=scala,true]tableEnv.connect(new Kafka().topic(topic) .properties(properties) ...
我将hadoop设为高可用以后,datanode节点看不全 我做了两个namenode,一共4个datanode 为什么active的namenode能看到两个data ...
在做hadoop高可用的时候namenode启动不了 提示 Port 9000 specified in URI hdfs://jzyc5.com:9000 but host 'jzyc5.com' is a ...
目前系统为oracle的数据仓库,由于点击流数据的指数增长,目前关系型数据已经无法满足,需要将现有的oracle的数据仓库迁移到基于 ...
想请教一下,为什么说 不论怎么调参数,都不能让多个小文件“划入”一个 split ?
指定KETTLE_PLUGIN_BASE_FOLDERS属性到plugin后还是啥找不到插件(执行本地文件拷贝到hdfs任务,用到Hadoop Copy Files插件 ...
看了好多帖子说 实际中我发现,TotalWriteTime总是小于WriteBlockOpAvgTime, 我很疑惑,为什么会这样 我想计算datanode的读 ...
当我的NameNode启动后,运行状态是Running,虽然pid在这里,但是这个服务是否是可用的健康状态呢?这个可用的健康状态要怎么确定 ...
ApacheHadoop Apache版本衍化ApacheHadoop版本分为两代,我们将第一代Hadoop称为Hadoop 1.0,第二代Hadoop称为Hadoop 2.0。第 ...
1.Spark中默认的序列化方式?2.配置kryo序列化? 3.合理的设置序列化参数? 序列化有时是shuffle和cache的瓶颈 ...
问题导读 1.如何进行资源参数调优?2.有哪些调优技巧? 所谓Spark资源参数调优,其实主要就是 ...
Hive上跑没有问题,在Presto上跑就有报错了还请大佬帮忙看一下。
本版积分规则 发表帖子
查看 »