hadoop论坛|社区

About云-梭伦科技»专题 › 交流区› 技术交流

技术交流

收录了 1636 篇文章 · 11 人关注

版块操作

关注本版 RSS订阅

发布新帖

技术交流和问答

推荐主题

新窗

求java 写一串spark 代码

想实现row_number()功能 ,如 data01,data02字段 a,7 a,2 a,3 b,2 b,3 c,9 实现按ID分组加1 a1,7 a2,2 a3,3 b1,2 b2 ...

ananan36 2018-7-15 1 6647
修改hadoop配置文件后，一定得重启集群吗？

修改hadoop配置文件后，比如core-site.xml,hdfs-site.xml等配置文件后一定要重启集群吗？有没有动态更新配置文件信息的？大大求 ...

long1657 2014-9-15 8 71154
yarn怎么限制cpu资源使用

机器16core(32 超线程) 64G yarn.nodemanager.resource.cpu-vcores=32 mapreduce.reduce.cpu.vcores=1 mapreduce.reduce ...

jinwensc 2018-6-24 2 13152
请问怎么测出namenode元数据占用的内存

各位好，开始没有往HDFS上传文件，上传40000个小文件后，那么这些小文件占用的内存是怎么测出来呢？

halloki_pinjN 2018-6-25 4 5916
centos7 Installation configuration zabbix3.X

本帖最后由指尖十段丶LePeW 于 2018-6-23 00:32 编辑提：zabbix3.0对OS的要求：mysql5.0以上版本、apache1.3以上版本、php5. ...

指尖十段丶LePeW 2018-6-23 0 5329
spark运行rdd过程中,调用方法的过程中卡死

我最近有个实现,rdd存的是一个多边形的边界,通过WKT来进行判断这个边界是否与另外一个多边形边界数组存在相交的状态，然后在集群 ...

我的蜡笔丢了 2018-6-8 1 5068
关于HBASE的rowkey设计

之前用过hbase，当时因为没有设计好表，后来数据量上来了之后，花费了很大时间才把表重新分区了。当时的rowkey设计是:uid+date ...

ld512870 2018-4-26 12 16862
请问hbase如何设置region大小啊

请问hbase如何设置region大小啊

howtodown 2014-6-3 6 39082
求助: 搭建hadoop集群后，可以访问到HDFS管理界面，但MR管理界面访问不...

jps看进程ResourceManager也有但就是进不了MR管理界面。。。不知道是什么问题。。。求助大神

canqing 2018-5-30 13 18994
求助：hadoop安全审计

地址：https://github.com/databps/chiwen 各位表哥，我按照上面的说明已经都编译好了。如下： jar包也已经按照上面说的两个 ...

waxzz 2018-6-1 4 7182
spark-streaming 的 transform 方法

Stream-dataset joins这在种操作在前面解释DStream.transform操作时已经进行了展示。下面的例子是另一个join窗口流与数据集的例 ...

jsh0401 2018-5-30 5 7404
求助！无法找到JAVA_HOME

你好！请求帮助！centos6.8安装CDH5.9.2 4台物理机器 192.168.200.101 master 192.168.200.102 node1 192.168.200.102 node2 ...

youngwenhao 2017-5-9 7 11767
CDH 5.7.0中如何设置NameNode GC参数

使用的是CDH-5.7.0 集群中出现问题：暂停持续时间 ( [*] HBDP [*] HDFS [*] Na ...

sunt99 2016-12-6 10 38851
一段JAVA代码不知道碾压多少小伙伴，请大神科普！！

[mw_shl_code=java,true]import java.util.ArrayList; import java.util.List; public class Torment { public stati ...

evababy 2018-5-25 2 5993
关于hadoop的一些疑问

hdfs get 或者put的时候是blocks的读写并行还是串行的?写得时候文件是切分成几个block文件还是通过index来方式,读的时候文件 ...

jinwensc 2018-5-9 5 7378
spark-sql与hive的几点疑问

spark-sql在使用mysql存储元数据，创建的表都存储在hdfs的情况下，是否可以不安装hive? 我现在hive，spark都装了，每次启动spark ...

czs208112 2017-11-29 5 8868
学习大数据对企业有什么作用？

大数据一般解决哪些问题比较好？

中国风2000 2017-9-1 1 5047
数据批量分析提取，求指点迷津

苦逼的数据工作，在里面沉陷，试着做了一个小小的雏形工具： 1、导入杂乱信息的文档 2、把线头理出来 3、批量提取： ...

q2488433945 2018-4-17 3 5698
今日头条用户定向预估的实现方案

看到今日头条的广告投放平台，可以选择各种维度的用户定向条件，并根据不同的条件组合实时给出预估覆盖用户量，感觉把各种维度组 ...

erbin 2018-4-25 13 15898
求助！！！！完全分布式搭建hadoop2.7.5出问题！

Namenode启动没有报错，但在master上jps后没有除了jps进程其他啥都没有，而两个datanode节点启动完好，为啥？

小小哈 2018-4-19 2 5979
集群正常工作，有两个节点，一个有hbase日志，一个没有日志。

如题： hbase-hduser-master-slave2.log显示内容如下： 2018年 03月 22日星期四 18:06:02 CST Stopping hbase (via master) ...

damaicha226 2018-4-16 1 4094
求问用cloudera装好CDH启动datanode会超时，log如下

datanode是2G内存，我只是实验，不做大项目工具，求教大神们是因为什么，如何解决[mw_shl_code=java,true]HTTP ERROR 500 Pro ...

exikee 2016-1-4 6 29415
Flume TaildirSource如何实现递归动态目录

需求描述使用了SpoolDirectorySource可以配置一个监听目录，会监听该目录下所有的文件，但是如果配置目录下面嵌套了子目录 ...

qcbb001 2017-3-24 2 19135
hive安装的mysql,需要多台安装吗

问下，hive安装的mysql要部署在hadoop环境吗？还是独立部署一台机，通过hive去掉就行

hyj 2014-5-7 2 17566
spark有没有全局缓存？想缓存一个文件内容供给一个任务使用

spark有没有全局缓存？想缓存一个文件内容供给一个任务使用

ananan36 2017-11-18 5 7730
请问下Hadoop完全分布式集群搭建好之后

请问下Hadoop完全分布式集群搭建好之后通过浏览器查看集群情况，必须要局域网的电脑登陆这个网站才能查看吗还是外网也可以。还 ...

墨离殇 2017-11-29 2 7414
sqoop导入数据到spark-sql

我的集群上既有hive，又有spark-sql，元数据在mysql中各自独立，我现在要利用sqoop把mysql表中的数据导入spark-sql，注意不是hiv ...

czs208112 2017-12-3 4 17235
hadoop都启动了为什么localhost:50070不能连接

hadoop都启动了为什么localhost:50070不能连接

xng2012 2013-11-21 5 29413
hbase+hive+impala 报gc overhead limit exceeded

简单说一下情况，由于impa查询hbase效率低，准备把hbase里的数据拷贝到impala里，数据量应该在几十亿到上百亿，机器配置是13个节 ...

是饭饭 2018-3-20 2 12232
spark thrift server服务提交yarn，usercache下的appcache/application_xxxx不会删除

/yarn/local/usercache/hdfs/appcache/application_1516695361311_276643/下的历史文件不会删除，有人遇到吗

ananan36 2018-4-2 1 8009