小知识分享区
收录了 13 篇文章 · 2 人关注
分享IT技术如:大数据,人工智能,区块链方面的小知识点,阅读1到2分钟,快速掌握知识
收起/展开

子版块

K8s
K8s
主题: 1, 帖数: 4
最后发表: 2018-3-22 11:07
Spark
Spark
主题: 24, 帖数: 42
最后发表: 2021-10-27 07:11
Flink
Flink
主题: 3, 帖数: 4
最后发表: 2021-7-6 15:57
Hbase
Hbase
主题: 19, 帖数: 41
最后发表: 2020-7-8 05:33
Kafka
Kafka
主题: 7, 帖数: 13
最后发表: 2021-7-22 06:20
Storm
Storm
主题: 3, 帖数: 7
最后发表: 2018-5-22 18:11
Hadoop
Hadoop
主题: 40, 帖数: 95
最后发表: 2020-6-15 20:23
搜索组件
搜索组件
主题: 3, 帖数: 5
最后发表: 2020-3-16 09:57
Cloudera系列
Cloudera系列
主题: 5, 帖数: 6
最后发表: 2018-10-31 11:17
Flume
Flume
主题: 1, 帖数: 3
最后发表: 2015-6-16 08:46
Hive
Hive
主题: 28, 帖数: 60
最后发表: 2022-3-16 10:45
Sqoop
Sqoop
主题: 3, 帖数: 9
最后发表: 2018-8-20 17:10
Zookeeper
Zookeeper
主题: 4, 帖数: 6
最后发表: 2018-7-15 16:36
大数据综合
大数据综合
主题: 1, 帖数: 4
最后发表: 2020-3-28 09:10
深度学习
深度学习
主题: 0, 帖数: 0
从未
数据挖掘
数据挖掘
主题: 1, 帖数: 1
最后发表: 2017-2-22 09:27
机器学习
机器学习
主题: 1, 帖数: 1
最后发表: 2018-8-23 17:20
算法
算法
主题: 1, 帖数: 2
最后发表: 2018-9-19 00:29
区块链
区块链
主题: 19, 帖数: 35
最后发表: 2018-12-6 17:13
其它
其它
主题: 3, 帖数: 4
最后发表: 2021-10-10 22:27
  • 问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? ...

    pig2 2020-7-29 6 9699
  • 问题描述: 使用MergeTree引擎建表,进行插入数据时,发现数据重复。 原因: MergeTree的主键(PRIMARY KEY)只是用来 ...

    hyj 2021-6-4 12 12148
  • 在开发中,一般来讲,我们都是通过代码开发,比如Java,Scala等来写mapreduce,spark编程等。然后如果使用shell编程来实现,效率 ...

    howtodown 2018-3-20 5 8786
  • 在统计学领域,数据分析划分为:描述性数据分析、探索性数据分析、验证性数据分析。         数据分析的目的主要 ...

    langke93 2015-5-25 3 16536
  • 问题导读:1. 数据和信息的关系?2. 信息和智慧的关系? 我时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他 ...

    Oner 2016-5-1 3 8589
  • idea已经被很多人使用,通过IDEA查看源码,是经常的事情,那么该如何查看,下面是实用快捷键: 进入该类或方法:ctrl+鼠标点 ...

    admin 2020-5-3 2 3781
  • 因数据核查需要,在一堆压缩文件中(共8269个压缩文件,200G的存储空间)找是否有乱码;在网上搜索了好的办法,结合自己实践,找 ...

    aaronping 2016-4-13 1 9226
  • 事实表和维度表的分界线 事实表是用来存储主题的主干内容的。以日常的工作量为例,工作量可能具有如下属性:工作日期,人 ...

    阿飞 2020-5-18 1 4672
  • 1、 什么是MPP? MPP (Massively Parallel Processing),即大规模并行处理,在数据库非共享集群中,每个节点都有独立的磁盘 ...

    WX_vr289519ar 2020-11-2 1 2052
  • 1、确定需要执行重分区的topic,可以指定多个,建议每次重分区一个;(重分区之前检查下topic大小) 2、生成分区方案 注 ...

    nettman 2021-6-7 1 2265
  • 幂等(idempotence)一词原为数学上的概念,用一个最直观的数学式子表达为: f(f(x)) = f(x) 对应到软件开发领域,即为同样 ...

    hyj 2019-12-19 0 2708
  • 数据库:用于日常的事务处理,存储数据量相对较小,对于存储和查询都有相应的优化,但是对于历史数据量很大的情况下就不适用 ...

    阿飞 2020-5-18 0 2048
  • 表具有一些特性,这些特性定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。描述表 ...

    pig2 2020-6-30 0 2241
  • 充当业务系统与数据仓库之间的过渡区。数据仓库的数据来源复杂,可能分布在不同的数据库,不同的地理位置,不同的应用系统之中 ...

    pig2 2020-8-9 0 3511
快速发帖
还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条