热搜词:

科大讯飞申请模型训练图文识别方法等专利,保证复杂场景图文识别准确性

金融界2025年4月2日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“模型训练、图文识别方法、装置、电子设备和存储介质”的专利,公开号CN 119741501 A,申请日期为2024年12月。

专利摘要显示,本发明提供一种模型训练、图文识别方法、装置、电子设备和存储介质,其中方法包括:基于初始识别模型的视觉分支和语义分支,分别提取样本图像的视觉特征和语义特征;基于字符一致但排序不同的多个样本图像的视觉特征之间的差异,确定视觉约束损失;基于语义一致的多个样本图像的语义特征之间的差异,和/或,语义相近的多个样本图像的语义特征之间的差异,确定语义约束损失;基于视觉约束损失,对视觉分支进行参数迭代,以及,基于语义约束损失,对语义分支进行参数迭代,基于参数迭代完成后的初始识别模型,确定训练完成的图文识别模型。本发明提供的方法、装置、电子设备和存储介质,保证了复杂场景下图文识别的语义合理性和识别准确性。

天眼查资料显示,科大讯飞股份有限公司,成立于1999年,位于合肥市,是一家以从事研究和试验发展为主的企业。企业注册资本231173.4185万人民币,实缴资本128450.0991万人民币。通过天眼查大数据分析,科大讯飞股份有限公司共对外投资了130家企业,参与招投标项目5000次,财产线索方面有商标信息2678条,专利信息5000条,此外企业还拥有行政许可57个。

本文源自:金融界

作者:情报员