关键词:
图像检索
外观设计专利
协同训练
重排
信息熵
置信度
摘要:
随着科技的进步,知识产权在国家的综合国力竞争中扮演着越来越重要的角色。专利是知识产权的重要组成部分,记录着大多数发明人的发明以及创新性成果。外观设计专利是专利中的发明创造中的一种重要的表现形式,是一种包含有造型、图案、色彩以及三者的有机结合形成的适合于工业应用上的新设计,图像是外观设计专利的主要表现形式,基于图像的外观设计专利检索应运而生。随着互联网和多媒体技术迅猛发展,专利数量以及专利图像也以几何级数增长,如何有效的从专利大数据库中检索出用户需要的信息是现在专利检索的主要研究方向。自上世纪90年代提出基于内容的图像检索后,图像检索技术发展迅速,基于内容的外观专利图像检索技术也越来越成熟,在检索的精度和检索的实时性方面仍有比较大的提升空间。文中针对外观设计专利图像特点改进了特征的提取算法,以及改进图像检索中多特征融合算法,提高图像的查准率和查全率。本文从图像特征改进和相似度学习进行特征融合两个方面开展了研究,论文主要工作如下:(1)针对外观设计专利图片主体居中的特点,提出了一种新的纹理特征提取方法,LBP加权分布纹理熵。通过对图像进行非均匀分块,然后在提取每个子块的LBP纹理,并统计每个子块的LBP纹理的信息熵,结合9个子块的纹理信息熵形成一个新的纹理特征,即考虑了图像的空间信息的同时还保留了图像的纹理信息。(2)提出一种基于重排和SIEAC的协同训练算法。利用样本信息熵和置信度(sample information entropy and confidence,SIEAC)对协同转导输出样本进行决策判断,并结合重排的思想提出了基于重排和样本信息熵以及置信度的协同训练图像检索,并在外观专利数据库上对提出的算法做了相应的实验验证本文提出的方法的有效性。(3)分析了五种不同的特征,并将这些特征应用于本文提出的基于重排和SIEAC的协同训练图像检索算法中。五种不同的特征分别是LBP,本文提出的加权分布纹理熵特征,方向梯度直方图(Histogram of Oriented Gradients,HOG),分层梯度方向直方图(Pyramid Histogram of Oriented Gradients,PHOG),CNN特征。(4)基于外观设计专利数据库开展了算法的验证。为了提高外观设计专利图像检索的精度以及效率,将基于重排和SIEAC的协同训练算法应用于外观设计专利图像检索上,并进行了相关实验证明不同特征组合在本文提出的算法中在检索性能方面的优势。