科技信息

2010, No.355(35) 671-672

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于语境和语义的中文文本聚类算法研究

吴勇;周军;

摘要(Abstract):

基于语境和语义的聚类算法,一方面从领域、情景、背景三方面提取特征词,建立语境框架文本特征,另一方面计算关键词TF-IDF权重值,形成关键词VSM向量空间。将两方面得到的特征项分别存储,构造特征空间。分两次聚类,第一次聚类对语境框架文本特征进行聚类,将相同语境的文本归为一类,达到快速聚类的效果。第二次聚类在第一次聚类的基础上,对各语境类内的文本再一次聚类,利用文本关键词向量空间进行语义计算,实现更细致的划分,达到提高聚类精度的目的。

关键词(KeyWords): 语境;语义;特征提取;VSM;聚类

Abstract:

Keywords:

基金项目(Foundation): 湖南省教育厅资助科研项目,项目编号09C1163

作者(Author): 吴勇;周军;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享