本发明公开了一种基于多任务学习的词向量训练方法、系统、设备及介质,所述方法包括:获取训练集,所述训练集包括文本词语序列?命名实体标签序列的配对数据;搭建语言模型模块和命名实体识别模块,将语言模型模块和命名实体识别模块作为外部模块;交替训练词向量字典和外部模块,所述词向量字典采用文本词语序列和外部模块的输出进行训练,所述语言模型模块采用词向量字典训练输出的词向量序列进行训练,所述命名实体识别模块采用词向量字典训练输出的词向量序列和命名实体标签序列进行训练。本发明可以提高词向量在多个外部实际任务中的测试效果以及增强词向量表示的鲁棒性。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号