• 简体   /   繁体
基于多模态特征融合的场景文本识别-计算机应用研究2025年04期

基于多模态特征融合的场景文本识别

作者:蔡明哲 王满利 窦泽亚 张长森 字体:      

摘 要:为了解决自然场景文本图像因为遮挡、扭曲等原因难以识别的问题,提出基于多模态特征融合的场景文本识别网络(multimodal scene text recognition,MMSTR)。首先,MMSTR使用共享权重内部自回归的排列语言模型(试读)...

计算机应用研究

2025年第04期