简介概要

基于全局交互的图像语义理解方法

来源期刊:控制与决策2020年第9期

论文作者:库涛 熊艳彬 杨楠 林乐新 朱珠

文章页码:2103 - 2111

关键词:卷积神经网络;循环神经网络;图像语义理解;全局交互机制;数据正则化;门控循环单元;

摘    要:针对图像语义生成过程中图像信息易模糊的问题,提出基于双向门控循环单元(GRU)和图像信息全局交互相结合的图像语义生成模型,通过图像和文本数据进行正则化处理和文本向量映射方法,实现模型驱动的图像语义生成.实验结果表明,所提出模型能较好地解决数据稀疏和偏态问题,采用GUR单元可以进一步降低模型参数规模,加快算法收敛速度,有效抑制模型过拟合,提高图像内容的丰富度、准确性和逻辑性.

详情信息展示

基于全局交互的图像语义理解方法

库涛1,2,熊艳彬1,2,3,杨楠1,2,3,林乐新1,2,朱珠4

1. 中国科学院沈阳自动化研究所2. 中国科学院机器人与智能制造创新研究院3. 中国科学院大学4. 辽宁大学信息学院

摘 要:针对图像语义生成过程中图像信息易模糊的问题,提出基于双向门控循环单元(GRU)和图像信息全局交互相结合的图像语义生成模型,通过图像和文本数据进行正则化处理和文本向量映射方法,实现模型驱动的图像语义生成.实验结果表明,所提出模型能较好地解决数据稀疏和偏态问题,采用GUR单元可以进一步降低模型参数规模,加快算法收敛速度,有效抑制模型过拟合,提高图像内容的丰富度、准确性和逻辑性.

关键词:卷积神经网络;循环神经网络;图像语义理解;全局交互机制;数据正则化;门控循环单元;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号