分享

请问个关于微博文本处理的问题

sunshine_junge 发表于 2014-11-10 10:07:12 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 7877


请问个关于微博文本处理的问题:
       如果对于所有微博文本先进行按主题分类(如使用SVM 算法),那么分完类之后的文本数据还是之前的文本,还是变成了向量表示了。接下来进行的处理是,在对各个主题下的微博做类似词频统计的操作。有什么想法或建议吗?非常感谢。
欢迎加入about云群90371779322273151432264021 ,云计算爱好者群,亦可关注about云腾讯认证空间||关注本站微信

已有(1)人评论

跳转到指定楼层
desehawk 发表于 2014-11-10 12:59:36
楼主是要做什么,微博文本处理的目的是什么?
短文本的处理模型有两种
一种是向量空间表示模型
一种是潜在主题表示模型

至于是不是,个人认为在于选择使用什么模型来表示。


这条路很长啊,楼主要挺住。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条