本发明公开了一种基于融合语义聚类的文本自动摘要方法,包括:文本预处理步骤,对原始文档进行预处理,并统计关键词在文本中的词频信息;权重计算步骤,融合局部权重,全局权重和引入相关权重来确定关键词在句子中的贡献度;语义分析步骤,将文本矩阵进行奇异值分解,得到语义分析模型,以此计算每个句子的语义向量;聚类步骤,对计算的句子语义向量在语义空间中通过聚类算法得到K个句子簇;句子选择步骤,在每一个句子簇中计算句子权重,根据排名来挑选前n个句子组成摘要,并去除冗余。本发明简单实用,对文本进行特征表示,融入上下文的语义联系,更充分的显示句子之间和词语之间的共现关系,生成的摘要更能契合文本的主题思想。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号