关键词:
多维查询
推荐系统
个性化商品检索
视觉问答
语言先验问题
摘要:
大数据时代的到来为国家及社会带来了巨大发展机遇,但同时也提出了诸多技术挑战。如何有效地利用大数据信息以提高经济社会效益,已经成为影响国计民生的关键因素。信息检索旨在从冗余复杂数据中针对已有查询准确获取相关信息,是大数据背景下的一个重点研究领域。实际上,信息检索的应用任务与场景广泛,包含网页检索、推荐系统、商品检索、问答系统等。本学位论文从查询维度的角度出发,对多种信息检索任务所存在的关键问题进行了研究。本学位论文主要面向多维查询的信息检索技术,在三种维度查询场景下分别针对典型问题进行研究。具体来说,对基于元维查询的推荐系统任务,本学位论文研究了一种广义度量学习方法,并将其应用于因式分解机推荐系统算法中。对基于一维查询的商品检索任务,本学位论文从时间角度和空间角度两个方面,分别完善商品检索中用户的检索偏好。对基于二维查询的视觉问答任务,本学位论文从数据分析、模型训练、模型评估三个不同方面进行研究,试图解决视觉问答中的语言先验问题。本学位论文的主要工作和创新性包含以下三个方面:(1)基于元维查询的广义度量学习推荐系统算法传统的因式分解机方法仅对属性间关系进行建模,未考虑属性内部的特征交互关系。而属性内部的交互关系对因式分解机模型也极为重要,具体可分为线性和复杂非线性两类关系。本学位论文提出了一种广义度量学习方法,并应用于因式分解机模型中,进而设计了一种结合广义度量学习的推荐系统模型,对属性内部的两种特征交互关系进行建模;同时提出了一种高效算法降低了该模型的时间复杂度,具有一定的可行性。(2)基于一维查询的商品检索全局偏好建模方法现有商品检索方法仅对用户的局部偏好进行建模,检索效果欠佳,本学位论文从两个角度分别提出了一种全局偏好建模方法。具体来说,在时间角度上,本学位论文首次将用户的长期偏好与短期偏好进行整合。考虑到两种偏好中不同因素对当前查询结果的影响程度不一,本文提出利用注意力机制方法,对其中的不同因素进行差异化建模。此外,在空间角度上,本学位论文将用户对视觉模态的偏好引入商品检索中,与用户对语言模态的偏好相结合,并借助基于翻译的模型实现检索目标。(3)基于二维查询的视觉问答语言先验问题解决方法本学位论文从三个方面对视觉问答中的语言先验问题进行了探索研究。首先,在数据分析角度上,本文提出从类别不平衡视角重新解释语言先验问题,设计了一种克服类别不平衡的方法并成功应用;在模型训练角度上,本文设计了一种损失函数,从答案特征空间学习的视角认识并解决语言先验问题。最后,在模型评估方面,本学位论文提出了一种衡量视觉问答模型中语言先验效应的评价指标,该指标同时考虑了训练数据集中的答案分布和当前模型的预测结果。此外,本文设计了一种正则化方法,既可以缓解模型产生的语言先验问题,又可以提升模型答案检索的准确度。