本发明公开了一种基于无监督学习的文本相似度计算方法、系统、设备及介质,所述方法包括:获取训练集,将训练集中的每篇文本作为摘要生成网络的输入,得到每篇文本对应的摘要,构成文本集合与摘要集合;搭建相似度计算网络;采用文本集合和摘要集合对相似度计算网络进行训练;将待处理的两篇文本输入训练后的相似度计算网络,输出这两篇文本的相似度。本发明无需人工标记的配对数据就可以进行训练与学习,大大降低了数据获取的成本。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号