hadoop论坛|社区

About云-梭伦科技»专题 › 交流区› 技术交流

技术交流

收录了 1636 篇文章 · 11 人关注

版块操作

关注本版 RSS订阅

发布新帖

技术交流和问答

子版块

Flink 主题: 6, 帖数: 23 最后发表: 2020-12-17 18:32	NoSQL型数据库主题: 213, 帖数: 850 最后发表: 2020-4-30 20:09	MapReduce 主题: 418, 帖数: 2118 最后发表: 2024-6-14 08:41
HDFS 主题: 554, 帖数: 2448 最后发表: 2022-11-7 15:25	HBase 主题: 474, 帖数: 2602 最后发表: 2020-7-18 16:16	Storm 主题: 163, 帖数: 871 最后发表: 2021-11-17 09:53
Hadoop\|YARN 主题: 333, 帖数: 1572 最后发表: 2021-3-17 09:36	Flume 主题: 121, 帖数: 842 最后发表: 2020-8-31 11:22	Hive 主题: 401, 帖数: 2227 最后发表: 2021-8-7 19:30
ZooKeeper 主题: 44, 帖数: 160 最后发表: 2020-3-16 09:27	Cloudera系列主题: 319, 帖数: 1689 最后发表: 2020-7-16 10:14	Pig 主题: 11, 帖数: 67 最后发表: 2020-5-12 13:52
Sqoop 主题: 102, 帖数: 565 最后发表: 2021-3-23 14:25	Kafka 主题: 87, 帖数: 415 最后发表: 2020-11-27 13:54	Spark 主题: 595, 帖数: 3216 最后发表: 2022-4-6 18:10
Oozie 主题: 38, 帖数: 191 最后发表: 2020-7-17 10:39	Scala 主题: 46, 帖数: 136 最后发表: 2024-10-21 13:44	Solr\|Nutch\|Lucene\|ES 主题: 78, 帖数: 298 最后发表: 2020-7-16 14:41
Kylin 主题: 12, 帖数: 56 最后发表: 2019-8-8 13:40

推荐主题

新窗

隐藏置顶帖 Hadoop3.3新版本发布【整合了腾讯云】

问题导读 1.Hadoop3.3支持JDK哪个版本？ 2.SCM是什么？ 3.YARN应用程序做了哪些改进？ 4.整合腾讯云实现了什么文件系统？ ...

pig2 2020-7-29 6 9696
隐藏置顶帖请问，在两台电脑上能安装hbase分布式吗？

我只有一个master和一个slavehbase.zookeeper.quorum怎么配置？配置zookeeper集群我看文档，要求这个参数必须是奇书，我只有一个 ...

xng2012 2013-10-31 8 19844
谁知道hdp源码在哪里下载，谢谢！

谁知道hdp源码在哪里下载，谢谢！签到。。。。

wubo2cyp 2015-12-2 5 15152
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布式集群HA部署

【2015年6月19日】刚接触Hadoop两个月，因为公司要用，所以现学的，看的文章比较杂，尤其是1.x和2.x的混着看，越看越理不清头 ...

xiazy 2015-6-11 23 155320
hadoop的reduce阶段卡住的问题

2013-10-14 18:02:37,237 INFO org.apache.hadoop.mapred.TaskTracker: attempt_201310122012_0637_r_000000_0 0.16666667% redu ...

allenpony 2013-10-16 5 20777
mahout 中recommend 第一参数用户为字符型问题

在基于用户推荐中 recommend 第一参数用户为long型，而我数据库中地用户id是字符型有其他方法吗？要自己写转换程序吗 ...

13589573 2017-3-11 3 7499
0基础学Python如何成为高手？我有几点干货

最近，很多小伙伴问我，如何才能自学成为 Python 高手？根据自己多年大厂工作经验和带领数千朋友的学习，信盈达小编总结了几点小 ...

we_plus 2021-8-16 0 2042
0基础学技术，IT培训机构要不要去

大部分的新人、毕业生或者想转行的人群，所以他们面临的第一个迷茫就是选择入门的途径问题。现在冬天，又是养精蓄锐的季节，工作 ...

we_plus 2021-8-15 0 1942
Perl语言中文版下载

nettman 2013-12-4 2 7977
用深度学习解决太阳能电池片颜色分选问题

太阳能电池片颜色深浅不一，需要按颜色进行分档分类，在只有极少量标签的情况下，只能使用深度学习中的无监督或半监督来完成，目 ...

纷纷落进晨色里 2021-3-5 0 3410
跪求答案

自己做了一个很小的日志分析项目，面试问到以下问题，个人回答老露馅，没有经验，不知道怎么回答，求指导 ...

persist 2015-5-8 10 19649
漫谈数据治理

数据治理是当今快速发展和高度竞争的企业环境中的一项要求。现在，组织有机会捕获大量不同的内部和外部数据，他们需要一个规 ...

WX_uu55b92vvj 2021-1-10 1 3158
datanode web服务状态告警，求大佬给个思路

问题描述：datanode web服务器状态告警，分析日志没明显报错，那位大佬给下思路啊 Service Monitor日志查看有延迟情况： ...

hpf2015 2020-12-17 0 3534
docker mysqld: Error on realpath() on ‘/var/lib/mysql-files‘

docker 使用mysql8镜像时加载指定的外部配置文件和存储目录，报出 mysqld: Error on realpath() on '/var/lib/mysql-files' ...

joyray 2020-11-24 0 5843
kafka命令行工具卡住

kafka版本：0.9 CDH版本：5.12.2 问题描述：一个java写的通过zookeeper链接消费kafka的程序挂掉了，报错“error during sy ...

grinsky 2020-9-24 1 5073
海量数据多维度即席查询方案

来来来，讨论个问题，10TB的数据，每条数据有200个字段，要对这些字段进行即席查询，也就是用户自己选上字段自定义条件进行查询 ...

ld512870 2017-5-10 4 9208
elasticsearch是怎么在各个集群之间进行交互的。

es和solrcloud都是基于lucene的全文搜索引擎。其中solrcloud是借助于zookeeper这个分布式协调系统来实现集群中各个机器通信的。 ...

ld512870 2017-3-22 4 10728
flink 报AppendStreamTableSink requires that Table has only insert changes

[mw_shl_code=scala,true]tableEnv.connect(new Kafka() .version("universal") ...

ighack 2020-5-25 3 6794
关于flink1.10中kafka写入的问题

[mw_shl_code=xml,true] org.apache.flink flink-connector-kafka_2.11 1.10.0 [/mw_shl_code] ...

ighack 2020-5-15 3 5835
flink连kafka的json格式怎么执行SQL

[mw_shl_code=scala,true]tableEnv.connect(new Kafka().topic(topic) .properties(properties) ...

ighack 2020-5-15 3 6212
hadoop设为高可用,datanode节点看不全

我将hadoop设为高可用以后,datanode节点看不全我做了两个namenode，一共4个datanode 为什么active的namenode能看到两个data ...

ighack 2020-5-13 2 2895
Port 9000 specified in URI hdfs://jzyc5.com:9000 but host 'jzyc5.com' is a lo...

在做hadoop高可用的时候namenode启动不了提示 Port 9000 specified in URI hdfs://jzyc5.com:9000 but host 'jzyc5.com' is a ...

ighack 2020-5-13 3 6490
hive数据仓库更新删除的问题处理

目前系统为oracle的数据仓库，由于点击流数据的指数增长，目前关系型数据已经无法满足，需要将现有的oracle的数据仓库迁移到基于 ...

liyang417800 2014-6-25 3 34496
关于 mr切片大小的问题

想请教一下，为什么说不论怎么调参数，都不能让多个小文件“划入”一个 split ？

o13674976542 2020-4-20 4 3272
kettle big-data-plugin插件使用

指定KETTLE_PLUGIN_BASE_FOLDERS属性到plugin后还是啥找不到插件（执行本地文件拷贝到hdfs任务，用到Hadoop Copy Files插件 ...

一曲离殇 2020-3-30 2 5300
Datanode jmx参数疑惑，TotalWriteTime 小于 WriteBlockOpAvgTime

看了好多帖子说实际中我发现，TotalWriteTime总是小于WriteBlockOpAvgTime，我很疑惑，为什么会这样我想计算datanode的读 ...

macWang 2020-3-18 6 6510
Hadoop系列的健康可用性监控

当我的NameNode启动后，运行状态是Running,虽然pid在这里，但是这个服务是否是可用的健康状态呢？这个可用的健康状态要怎么确定 ...

macWang 2020-3-5 1 2886
hadoop版本差异详解

ApacheHadoop Apache版本衍化ApacheHadoop版本分为两代，我们将第一代Hadoop称为Hadoop 1.0，第二代Hadoop称为Hadoop 2.0。第 ...

muyannian 2016-1-18 46 70384
Spark性能优化（三）：序列化与压缩

1.Spark中默认的序列化方式？2.配置kryo序列化？ 3.合理的设置序列化参数？序列化有时是shuffle和cache的瓶颈 ...

regan 2019-11-27 0 4711
Spark性能优化（二）：资源参数调优

问题导读 1.如何进行资源参数调优？2.有哪些调优技巧？所谓Spark资源参数调优，其实主要就是 ...

regan 2019-11-26 0 3544
Presto如何支持Hive的日期函数？

Hive上跑没有问题，在Presto上跑就有报错了还请大佬帮忙看一下。

西岚 2019-11-5 1 4807