本发明公开了一种基于深度残差网络和LSTM的图像理解方法。所述方法首先构建一个深度残差网络模型提取图像的抽象特征并保存为特征矩阵;然后LSTM模型中的动态注意机制根据特征矩阵动态地生成合适的特征向量,最后LSTM模型根据特征向量生成成自然语言(英语)。本发明利用了深度残差网络在图像特征提取和LSTM对时序序列建模方面的优势,深度残差网络和LSTM模型成了一个编码?解码框架,将图像内容信息转化成自然语言,达到提取图像的深层次信息的目的。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号