分享

about云每日一读汇总(第27篇2018.07.02)

about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)

about云每日一读汇总(第十二篇2016.01.01)

about云每日一读汇总(第十三篇2016.04.01)

about云每日一读汇总(第十四篇2016.05.16)

about云每日一读汇总(第十五篇2016.07.18)

about云每日一读汇总(第十六篇2016.10.18)

about云每日一读汇总(第十七篇2016.12.05)

about云每日一读汇总(第十八篇2017.01.05)

about云每日一读汇总(第19篇2017.03.24)

about云每日一读汇总(第20篇2017.06.01)

about云每日一读汇总(第21篇2017.08.01)

about云每日一读汇总(第22篇2017.09.30)

about云每日一读汇总(第23篇2017.12.08)

about云每日一读汇总(第24篇2018.01.02)

about云每日一读汇总(第25篇2018.03.21)

about云每日一读汇总(第26篇2018.05.01)


about云2018年08月31日每日一读

带你一起机器学习:模型如何工作
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25160
1.本文什么场景?
2.本文选择了什么数据模型?
3.决策树预测底部的点叫什么?



书籍:
ssh权威指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25161


分布式Java应用基础与实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25162



外站经典:
机器学习和深度学习汇总【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25159



疑问解答:
ceph中启动openstack的虚拟机,断电之后虚拟机启动失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25158




about云2018年08月30日每日一读


实操演练:
带你一起机器学习:第一个机器学习模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25154
1.如何选择建模数据?
2.什么是特征?
3.本文使用什么建模?



书籍:
分布式算法导论
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25155


文档:
机器学习-模型评估与选择
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25156




about云2018年08月29日每日一读

技术应用:
深度学习在CTR预估模型中应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25151
1、如何理解降维版本的特征二阶组合?
2、如何使用embedding+MLP深度学习CTR预估的框架?
3、如何串联结合FM与MLP?
4、如何通过逐元素乘法延迟FM的实现过程?




文档:
Go 学习笔记 第四版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25149


书籍:
Spark机器学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25148


异常错误:
报了这个错No configuration setting found for key 'morphlines',是我路径不对吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25146




about云2018年08月28日每日一读

总结型:
Hadoop 2.x与Hadoop 3.x的22个点比较:3.x将节省大量存储空间
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25140
1.Hadoop3.x通过什么方式来容错?
2.Hadoop3.x存储开销减少了多少?
3.Hadoop3.x MR API是否兼容hadoop1.x?


介绍解说:
机器学习不只是调包系列--通过PMML解析线性回归和逻辑回归
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25144
1. 线性回归与逻辑回归的模型结构是怎样的?
2. 线性回归与逻辑回归的PMML描述是怎么样的?
3. 线性回归与逻辑回归模型最终通过代码体现的形式是什么?
4. 如何从零开始,用Scala实现一个线性回归或者逻辑回归模型?



书籍:
Java+8实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25141




about云2018年08月27日每日一读

Idea初步编程使用需要知道的事情【节省你的一到两周时间】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25134
1.Idea中红色字体代表什么含义?
2.灰色字体代表什么含义?
3.找不到相关包和函数原因是什么?



Spark 高级分析:第七章第10,11节 处理边三元组,分析过滤后的图
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25124
1.如何求样例数据中的文件总数?
2.图过滤的规则是什么?
3.如何分析过滤后的数据?




Kafka 1.1.0新特性 FETCH 带宽管理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25131
1.Kafka 1.1.0怎样进行FETCH带宽管理?
2.什么是fetch session?
3.Kafka 1.1.0中FETCH请求被分成了哪两类?



书籍:
Flume构建高可用、可扩展的海量日志采集系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25138


功能源码:
spark2 demo 【maven】例子
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25132


SPark2 wordcount 例子
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25135


心得体会:
实操演练看Spark之中map与flatMap的区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25133



疑问解答:
phoenix一直查询一张表很快,不停的切换表查询慢
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25130




about云2018年08月23日每日一读

介绍解说:
HBase Dataframe详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25108
1.HBase-Spark Connector的作用是什么?
2.HBase Dataframe可以与哪些数据源交互?
3.如何定义Catalog?




小知识:
大数据各个组件的用途
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25105


英文资料:
实时应用中敏捷机器学习的体系结构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25112


机器学习的准备和架构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25113




about云2018年08月22日每日一读

连载:
TensorFlow ML cookbook 第四章4、5节 实现非线性SVM和实现多类SVM
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25096
1、如何实现非线性SVM?
2、如何创建预测内核函数?
3、如何实现多类SVM?
4、如何在额外维度上调用TensorFlow的batch_matmul?



书籍:
Presto技术内幕
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25100



项目源码:
Facebook研究院开源受欢迎项目:FAIR的物体检测研究平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25098



疑问解答:
hbase过滤器使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25095


hive + kerberos spring 配置 DruidDataSource 数据库连接池
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25102





about云2018年08月21日每日一读

介绍解说:
流技术的未来:Apache Flink
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25090
1.为何会产生流技术?
2.流技术需要解决那些问题?
3.Flink有哪些优势?




英文资料:
Apache-Flink-1.6.0-新增功能完整文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25091


项目源码:
Flink源码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25089



方案探讨:
zookeeper鉴权
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25092




about云2018年08月20日每日一读

连载:
Spark 高级分析:第七章第8,9节 度分布和过滤噪声边
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25076
1.什么是顶点的度?为什么需要引入这个概念?
2.Graphx中内置的计算度的方法是什么?如何使用?
3.如何过滤噪声边?



利用Instagram图像进行AI算法的迁移学习训练
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25080
1.Instagram hashtag集对准确度的影响如何?
2.预训练图像集大小对准确度的影响如何?
3.hashtag标签的噪声对模型精度有什么影响?



书籍:
决战大数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25087


小知识:
从sqoop遇到错误论方法和能力的重要性
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25082



异常错误:
这错误一脸懵逼,进不去morphline command了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25078


疑问解答:
Spark streaming 消费数据延迟
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25083


【连载】深度学习笔记5:正则化与dropout
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25084


【连载】深度学习笔记6:神经网络优化算法之从SGD到Adam
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25085


其他:
如何做好数据可视化分析?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25079



about云2018年08月17日每日一读

第1部分:Kafka不同团队开发生产者和消费者,该如何定义消息格式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25071
1.对于不同团队负责写生产者和消费者,消息格式该如何商定?
2.什么样的格式性能更高?
3.如何实现序列化和反序列化?



文档:
使用Apache-Spark实现ETL-300%的速度提升
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25073


项目源码:
Kafka集群安全(用于测试和开发的VM)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25069


小知识点:
Spark ML 文本的分类demo
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25072


疑问解答:
openstack O版本 nova安装问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25070




about云2018年08月16日每日一读

总结型:
大数据安全组件有哪些,各自的优缺点分析及相关配置总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25062
1.大数据安全有哪些组件?
2.各自优缺点是什么?
3.Ranger该如何实现配置?


零基础从20K到25K的深度学习之路--3 用keras做一个回归模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25065
1.什么是回归?
2.需要什么基本的keras基础知识?
3.怎么实现一个线性回归的深度学习模型?



书籍:
Python最新书籍汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25064



疑问解答:
小白不会Morphine配置文件以及Avro的使用,求帮助!!!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25061




about云2018年08月15日每日一读

Flink框架在饿了么应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25053
1、如何理解一致性语义?
2、Storm、Sparkstreaming主要有哪些几个概念?
3、为什么使用Flink及Flink有哪些特性?
4、如何理解并行度概念?


书籍:
Python标准库示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25056



项目源码:
基于ConfigMap的方法,用于管理Kubernetes和OpenShift中的Spark集群。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25049


疑问解答:
CDH安装 Unexpected error. Unable to verify database connection.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25058



异常错误:
hive集群模式简单查询,也非常慢
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25048


Docker基础面纱之实战经验分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25054


其他:
【连载】深度学习笔记4:深度神经网络的正则化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25050



about云2018年08月14日每日一读

新版说明:
MLflow 0.4.2 发布:使用Azure Blob存储,PyTorch和TensorBoard跟踪以及H20支持
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25041
1.如何获取安装最新版本?
2.MLflow 0.4.2 新增了哪些功能?
3.MLflow 0.4.2修复了哪些功能?


吴恩达《Machine_Learning_Yearning》中文版:第50-52章流水线组件的选择
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25044
1.什么样的流水线组件可作为合适的选项呢?
2.独立的组件使得任务简单了多少?
3.算法可以输出一个完整的句子来对图像进行描述吗?


文档:
机器学习的数学基础-machine-learning
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25043




疑问解答:
spark sql启动的task数量和hbase 设置的numregion数量一致,如何自定义task数量
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25042




about云2018年08月13日每日一读

连载:
Spark 高级分析:第七章第6,7节 连通分支
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25035
1.什么是连通图?如何判断?
2.Graphx中内置的计算连通分支的方法是什么?如何使用?
3.判断图是否是连通图对数据分析有何意义?



实操演练:
如何使用Spark读取Hive,通过BulkLoad的方式导入到HBase
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25037
1.使用Spark访问Hive表,读表数据导入到HBase有哪几种方式?
2.怎样部署Spark集群?
3.如何使用Spark读取Hive表数据通过BulkLoad的方式快速的将数据导入到HBase?




入门帮助:
机器学习基础--如何全面学习机器学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25038


文档:
机器学习入门介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25039




about云2018年08月08日每日一读


原理型:
论前馈网络取代循环神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25013
1、为什么前馈网络能够在不降低性能的前提下取代循环神经网络?
2、为什么说前馈模型可以比循环模型表现更好?
3、如何理解自回归、前馈模型?
4、为何关注前馈模型?






书籍:
Spark大数据分析【核心概念、技术及实践】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25014


疑问解答:
怎么把hadoop 里面wordcount 这个工程用source insight 查看
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25012



about云2018年08月07日每日一读

在Redhat7.4安装CDH6.0.0_beta1文档及问题总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24999
1.CDH6按照包含哪几部分?
2.外部数据库支持哪些数据库?
3.外部数据库支持哪些版本?
4.CDH6是否支持jdk7?



书籍:
TensorFlow技术解析与实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25002


疑问解答:
初始化CM遇到N多问题,请大仙指导
http://www.aboutyun.com/forum.php?mod=viewthread&tid=25007




about云2018年08月06日每日一读

连载:
零基础从20K到25K的深度学习之路--2 实战第一个深度学习模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24994
1.机器学习并没有想象中那么难
2.机器学习工程师一般的工作步骤
3.来看看这个深度学习demo



连载:
Spark 高级分析:第七章第5节 用GraphX构造共现网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24987
1.怎样做有助于我们了解网络整体结构?
2.Graphx是什么?
3.
创建图对数据有什么要求

4.图可以描述哪些关系?



职业指导:
程序员与产品经理交手过招-谁之过【思考】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24988


Kafka2.0新特性最详细解析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24992
1.Kafka 2.0增加了哪些新特性?
2.Kafka 2.0修复了哪些问题?
3.Kafka 2.0有哪些安全措施?




小知识点:
spark-submit提交参数之num-executors,num-executors,executor-cores调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24993



书籍:
Python+Spark 2.0+Hadoop机器学习与大数据实战_林大贵(著)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24996




about云2018年08月03日每日一读


介绍解说:
Kafka 2.0.0版本新增改变了哪些功能详细
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24981
1.offset保留时间默认原先从一天改为几天时间?
2.https是哪个参数的值?
3.统计kafka2.0中修改了哪些属性?


疑问解答:
[求助]zookeeper服务在服务器重启后无法二次成功启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24977


yarn可以正常启动,但访问webui时只显示本节点的datanode。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24983


异常错误:
mapreduce出现异常:Error: org.apache.hadoop.ipc.RemoteException(java.io.IOExc...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24978


spark ClassNotFoundException
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24982


spark ClassNotFoundException
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24984


hadoop程序运行超时出错,其中之一的container日志如下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24959





about云2018年08月02日每日一读

介绍解说:
Cloudera6 Beta详解:更快的分析,改进搜索和更高的可扩展性
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24972
1.cloudera6哪些组件效率更高?
2.哪些组件成为完全的完全native 组件?
3.文中单个Cloudera Manager 6处理几千个节点?
4.什么是SDX?
5.Cloudera Enterprise 6.0主要包含哪些组件?



文档:
区块链与物联网如何融合
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24974


异常错误:
执行distcp任务出现log4jerror fileSet()错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24967




about云2018年08月01日每日一读

连载:
TensorFlow ML cookbook 第四章2、3节 减少到线性回归和在TensorFlow中使用内核
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24953
1、如何使用支持向量机拟合线性回归?
2、TF中如何实现损失函数?
3、如何在TensorFlow中使用内核?
4、如何在系统中创建一个预测点网格?



功能源码:
spark2demo功能源码分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24961

英文资料:
cloudera专题:kafka文档(CDK 3.1.x Powered By Apache Kafka)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24963


Kudu:快速数据存储的快速分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24962


异常错误:
hadoop程序运行超时出错,其中之一的container日志如下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24959




about云2018年07月31日每日一读

介绍解说:
深度学习AI如何实现美颜
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24947
1.深度学习分割算法有哪些?
2.换发色算法包含哪些流程?
3.Unet算法如何实现?
4.本文使用Unet算法如何实现美颜的?



文档:
区块链 在供应链金融中的应用研究
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24945


功能源码:
默克尔树:探索审计和一致性证明
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24950


疑问解答:
用sqoop从mysql导入hbase问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24946


异常错误:
spark去读取hive数据,报空指针异常,求助。。。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24944





about云2018年07月28日每日一读

连载:
Spark 高级分析:第七章第4节 医学主题词及其同现现象分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24928
1.如何获取样本数据的总体分布?
2.哪些主题词出现的频率最高?有什么规律?
3.
Scala库中方法combinations有何作用



连载:
Facenet开发实战之人脸库与识别系统搭建2【人脸识别】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24937
1.怎样搭建人脸库?
2.怎样结合SVM训练一个人脸识别系统?
3.怎样验证人脸识别系统?



英文资料:
统计学要素
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24941



异常错误:
用spark-submit 提交任务之后,怎么监测任务的运行状态呢,运行了百分比和最后是否...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24932



hive 脚本 GC overhead limit exceeded 求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24931


疑问解答:
spark循环中的变量问题,,foreach里面向map填值,在循环外面值没有了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24939





about云2018年07月27日每日一读

利用Docker实现Dubbo跨主机通讯
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24921
1.怎样利用Docker实现Dubbo跨主机通讯?
2.怎样解决Not found exported service问题?
3.怎样获取Dubbo暴露端口?




about云赠书活动【2018.07.26--07.30】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24926



其它:
你了解人工智能?机器学习?深度学习?一文带你解开所有疑惑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24918




about云2018年07月26日每日一读

人工智能在金融科技领域有哪些应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24914
1.  人工智能在金融科技领域中的哪些场景比较常见?
2.  人工智能如何应用在信贷风控场景?
3.  人工智能如何应用在智能反欺诈场景?
4.  人工智能如何应用在精准营销场景?
5.  人工智能如何应用在量化投资场景?



文档:
kafka sql入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24915


疑问解答:
Structured Streaming容错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24911




about云2018年07月25日每日一读

总结型:
常用机器学习和深度学习算法总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24907
1、如何理解有监督学习、无监督学习、强化学习?
2、如何理解贝叶斯分类器、决策树算法?
3、线性模型算法有哪些?
4、如何理解马尔可夫决策过程?



文档:
Spark最全面详解从理论、实践到案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24906



疑问解答:
MR编程如何只map不reduce且不进行sort与shuffle
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24904




about云2018年07月24日每日一读


Spark--最全面详解从理论、实践到案例【附案例及数据】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24883
1.spark有哪些使用场景?
2.spark有包含哪些组件?
3.spark在哪些厂商已经应用?
4.spark如何实现地震检测?




名企资源:
Hbase在小米实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24902



异常错误:
Yran的ResourceManager异常退出
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24901


方案探讨:
关于openstack控制节点的宕机的如何解决,怎么高可用?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24900





about云2018年07月23日每日一读

连载型:
Spark 高级分析:第七章第2,3节 获取数据并解析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24882
1.如何获取样本数据?
2.如何使用Scala解析XML文件?
3.
Scala解析XML文件需要导入依赖吗




介绍解说:
白话文玩Spark
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24891
1.为什么会出现Spark?  
2.Spark是什么?
3.大数据实时计算架构?

安装配置:
Facenet开发实战之环境搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24892
1.怎样安装和配置Facenet环境?
2.怎样LFW数据集?
3.怎样评估模型的准确率?



心得体会:
一图看懂Spark RDD Dataframe DataSet
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24893




疑问解答:
vmware桥接,IP地址问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24881


其他:
CTR 预估模型的进化之路
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24886


什么是深度学习和深层神经网络
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24889





about云2018年07月20日每日一读

美团:深度学习在OCR中应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24877
1、OCR技术发展历程有哪些?
2、文字行识别流程有哪些?
3、如何理解基于深度学习的文字检测?
4、如何理解基于序列学习的文字识别?



文档:
spark2.3文档:在Apache Spark 2.3中通过直方图估算基数及相关新内容
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24879



疑问解答:
cloudera monitor1个诡异的问题: master主机2分钟挂掉1次
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24875


sparkstreaming消费kafka 多分区如何保证顺序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24876




about云2018年07月18日每日一读

总结型:
浅谈NLP领域中ImageNet预训练语言模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24864
1、如何理解word2vec作用?
2、如何理解ImageNet?
3、ImageNet中有什么?
4、什么是语言建模?



介绍解说:
Spark MLFlow 介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24862
1.Spark MLFlow用来做什么的?
2.MLFlow解决了什么问题?
3.MLFlow哪些问题未解决?



名企资源:
Facebook实时数据处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24861



异常错误:
连接超时:java.net.ConnectException: Connection timed out: no further informa...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24860


疑问解答:
hiveserve2 ha搭建不成功
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24867




about云2018年07月17日每日一读

入门帮助:
kafka sql入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24854
1.kafka sql与数据库sql有哪些区别?
2.KSQL有什么作用?
3.KSQL流和表分别什么情况下使用?


书籍:
Netty实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24855


功能源码:
ksql实战:点击流demo
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24856


外站经典:
谷歌机器学习速成课程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24852




about云2018年07月16日每日一读

实操演练:
超级账本Fabric开发实战之环境搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24845
1.怎样安装Linux系统?
2.怎样安装Docker?
3.怎样安装Fabric?


入门帮助:
谷歌工程师教你机器学习入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24839
1.本文中传统编程区分橘子和苹果遇到了什么问题?
2.机器学习为何能很好地解决区分橘子和苹果?
3.什么是特征?
4.什么是标签?
5.分类器的作用是什么?

连载:
Spark 高级分析:第七章第1节 MEDLINE引文索引:网络分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24834
1.图论和网络科学是如何产生影响的?
2.GraphX是什么?
3.
MEDLINE是什么,有什么用




书籍:
git系统入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24847


疑问解答:
求java 写一串spark 代码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24846


各位老师,我用breeze的pinv求矩阵伪逆,为什么结果是错的?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24844




about云2018年07月13日每日一读

连载:
使用Kafka和KSQL进行实时系统日志处理 - 第1部分:过滤
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24827
1.kafka sql的作用是什么?
2.kafka sql如何实现过滤数据?
3.kafka sql对于过去的,现在接受的,以后接受的数据如何过滤?




视频:
kafka summit2018伦敦会议视频分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24828


书籍:
Kubernetes权威指南第2版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24829



心得体会:
大数据组件使用maven下载失败,无法重新下载
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24831


zookeeper通信端口的作用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24830


方案探讨:
cm可靠性
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24825





about云2018年07月12日每日一读

实操演练:
Python sklearn训练的模型导出为PMML
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24823
1.scikit-learn已经成为Python重要的机器学习库,那么如何将scikit-learn训练好的模型导出为PMML呢?



R训练的模型导出为PMML
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24822
1.R语言训练的模型如何导出为PMML文件?





技术应用:
通过KSQL分析Apache Kafka中的Twitter数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24821
1.KSQL如何获取Twitter数据?
2.获取数据后,如何分析Twitter数据?
3.KSQL基于什么平台?



小知识点:
cloudrea manager 执行创建文件夹目录错误总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24814



书籍:
MapReduce设计模式 [(美)迈纳,(美)舒克著]
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24816


kafka权威指南完整版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24815


功能源码:
Apache Kafka的API Streams的演示应用程序和代码示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24819


Confluent Platform和Apache Kafka的演示应用程序和代码示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24817


项目源码:
KSQL - Apache Kafka Streaming的SQL引擎
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24818





about云2018年07月11日每日一读

连载型:
TensorFlow ML cookbook 第四章1节 应用线性SVM
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24807
1、如何理解支持向量机?
2、如何理解软边际损失函数?
3、如何声明L2范数函数?
4、如何应用SVM算法?





项目源码:
使用Spark分析区块链事务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24810


视频:
分析Apache Spark中的区块链事务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24811


书籍:
Apache Kafka源码剖析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24812




about云2018年07月06日每日一读

Kubernetes, Kafka微服务架构模式讲解及相关用户案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24783
1.微服务有什么特点?
2.本文介绍了哪些案例?
3.你认为事件驱动的微服务、容器、Kubernetes和机器学习结合可以带来哪些发展?



名企资源:
知乎基于 Kubernetes 的 Kafka 平台探索和实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24786


K8S在华为全球IT系统中的实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24787



疑问解答:

请教各位老师,文件操作出现问题!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24779


hbase 监控页面怎么查看数据当前占用磁盘空间大小
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24781




about云2018年07月05日每日一读

吴恩达《Machine_Learning_Yearning》中文版:第47-49章端到端学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24774
1.构建情感分类需要哪两个组件?
2.端到端有哪些应用例子?
3.端到端学习有哪些优缺点?



视频:

Weka数据挖掘任务的机器学习算法的集合——入门视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24777

文档:
Weka数据挖掘任务的机器学习算法的集合——ppt下载【12章】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24776


疑问解答:
hive 求日UV,累积UV
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24768


hive 下实现连续日期输出
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24771


求解Mapreduce编程问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24773


异常错误:
openstack 创建云硬盘快照日志报字符集错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24769





about云2018年07月04日每日一读

神经网络AdamW优化算法理解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24757
1、Adam优化器是什么?
2、如何理解 AdanW 权重衰减与 L2 正则化?
3、如何实现 AdamW算法?
4、如何理解 AMSGrad算法?



美国通过机器学习加速基因组医学并改善患者结果
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24758



书籍:
Spark+MLlib机器学习实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24764


资源下载:
不止代码【阿里巴巴-职业发展黄金手册】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24765



疑问解答:
MR一个简单的逻辑判断,困扰了好久,求大神解答,谢谢
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24756


面试java算法题:
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24766


异常错误:
KafkaUtils.createDirectStream参数报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24763





about云2018年07月03日每日一读

推荐:
没工作经验到底有那些坑,该如何填坑解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24752



项目源码:
RapidML智能机器学习助手
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24753


书籍:
基于Apache Kylin 构建大数据分析平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24754



about云每日一读汇总(第27篇2018.07.02)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24748



about云2018年07月02日每日一读


连载:
Spark 高级分析:第六章第10,11节 文档相关性和词文档相关性
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24739
1.什么是文档相关性,如何计算?
2.什么是词文档相关性,如何计算?
3
.词和文档是否要先转化成向量?




移动端深度学习引擎优化实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24742
1.ARM平台优化三部曲是什么?
2.怎样使用多线程?
3.怎样对app安装包中库文件的大小进行精简?



书籍:
算法导论  原书第3版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24744


算法导论答案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24745



异常错误:
oozie定时spark2的任务一直running,并且查看任务发现有异常,但还是running
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24741




没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条