分享

spark mllib分组聚类求教

find5 发表于 2016-9-7 11:09:12 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 5 9379
用户信息:用户,经度,纬度,一个用户有多条记录
想把每个用户下点聚为5个类簇,对机器学习不太了解,不知该怎么处理,求解

已有(5)人评论

跳转到指定楼层
NEOGX 发表于 2016-9-7 14:22:51
感觉楼主需求有点模糊

这里有关于spark mllib的是一些视频,可以看看,有问题可以在交流
http://v.baidu.com/v?s=8&wor ... %C6%B5&fr=ala11

回复

使用道具 举报

find5 发表于 2016-9-7 14:49:45
本帖最后由 find5 于 2016-9-7 14:53 编辑
NEOGX 发表于 2016-9-7 14:22
感觉楼主需求有点模糊

这里有关于spark mllib的是一些视频,可以看看,有问题可以在交流

举个例子:有五个用户,这些用户每天会去不同地方,现在想对每个用户去的地方聚类,聚成几个类簇
是需要用户分组后再聚类吗?不知道该如何处理,求指导
回复

使用道具 举报

xuanxufeng 发表于 2016-9-7 17:11:55
find5 发表于 2016-9-7 14:49
举个例子:有五个用户,这些用户每天会去不同地方,现在想对每个用户去的地方聚类,聚成几个类簇
是需要 ...

可先确定聚类个数,一般为2个,5个也是可以的。
然后还需确定迭代次数
中心距离阈值等信息,然后不断迭代。
详细可以参考源码。

推荐参考

Spark MLlib KMeans聚类算法详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19745


回复

使用道具 举报

find5 发表于 2016-9-7 18:08:04
xuanxufeng 发表于 2016-9-7 17:11
可先确定聚类个数,一般为2个,5个也是可以的。
然后还需确定迭代次数
中心距离阈值等信息,然后不断迭 ...

你好,有些地方不太明白
定义聚类个数n,进行迭代,结果应该所有用户位置数据聚类成n个类簇,
这种适用于:“很多个用户,将每个用户按他自己移动轨迹聚类为n个”   吗?

刚接触,求解惑。。。


回复

使用道具 举报

xuanxufeng 发表于 2016-9-8 17:56:53
find5 发表于 2016-9-7 18:08
你好,有些地方不太明白
定义聚类个数n,进行迭代,结果应该所有用户位置数据聚类成n个类簇,
这种适用 ...

这个不是的。
首先需要对用户进行聚类,也就是对他们分类。
你对用户是如何分类的。
分为几类,这个就是K。
然后接着就需要对距离进行计算,但是用户其实是没有距离的。
所以你需要对用户定义一个距离。
比如用户分为
董事长
总经理
经理
总监
分别为:
董事长  1
总经理  2
经理     3
总监     4

距离确定之后,也就是解决了聚类的关键性问题,这里就和理论挂钩了。
所以接着你可以根据文章提供内容,接着往下面继续了。

同时推荐资源
聚类算法---以K-means算法实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19752




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条