TKDE'16_Relevance Feedback Algorithms Inspired By Quantum Detection

题目:Relevance Feedback Algorithms Inspired By Quantum Detection

作者: Massimo Melucci

来源:TKDE

日期:2016

有无代码: 无

1.引言

  • 目的:将查询向量投影到由特征向量张成的子空间上,使得相关性量子概率分布与不相关性量子概率分布之间的距离最大化。
  • RF(相关性反馈):
    • 正:收集有关检索到的文档的一些相关性评估信息,并通过在相关文档中找到的术语来扩展查询,
    • 负:通过在不相关文档中找到的术语来减少查询,
    • both:或者使用相关或不相关的文档重新加权。
  • pseudo(伪反馈):e.g.取topK作为相关文件
  • re-weighting的重要性
    • 不需要对添加的查询词项的重新进行磁盘访问
    • 不会在修改后的查询中引入嘈杂的术语
    • 提高召回率(可以将检索到的文档列表中排名较低位置的相关文档移动到最高排名并可供用户访问)
    • 提高精确度(第一次运行后置于最高等级的不相关文件可能会移至最低等级。)
    • 应用于上下文搜索,使用从上下文观察到的一些变量(例如最终用户的阅读次数或文档的复杂性)
    • 最著名的re-weighting:BM25
  • 文章提出:
    • define signal detection in terms of quantum probability.(The use of vectors and matrices in quantum probability)

2.论文主体

2.1 VSM(Vector Space Model)

  • 对于信息检索的VSM,我们可以用k维的实向量空间Rk表示查询(query)和文件
  • e.g. 三个文件“orange juice”,“apple juice”and “apple”
    • orange:(100)
    • apple:(010)
    • juice:(001)
    • “orange juice”:(101)(有点类似纠缠的表示)
    • 缺点是当词项很多时,会产生高维稀疏向量,还存在其他表示方式
  • 相似度由两个向量的内积结果表示

    2.2 RF ( Rocchio’s algorithm)

  • 使用相关文档和不相关文档调整query向量Pasted image 20230629015450.png

2.3 quantum probability

2.3.1 背景

在量子力学中,概率空间可以表示为向量、矩阵,以及它们之间的算子。

To each observable value,it is possible to correspond a basis vector of the k-dimensional space. Equivalently,to each observable value,it is possible to correspond a projector of the k-dimensional space. The equivalence relationship between a basis vector x and a projector A is that

\(A = xx^{\dagger}\) 可以举一个k=2时候的例子来理解投影算符的概念。从公式传达出的信息来看,其实它就是x的矩阵表示。

  • x因为是和概率有关,应该满足性质$ x =1$
2.3.2 Gleason Theorem

概率分布可以沿着称为密度矩阵的k维矩阵ρ的对角线排列

diag(ρ)=(p1,,pk)

经典概率分布对应的密度矩阵总是对角的,并且具有单位迹,因为对角元素之和为 1

当使用这种代数形式表示概率空间时,计算概率的函数是密度矩阵ρ乘以事件对应的投影得到的矩阵的迹。

Trace(ρ|xx|)

当密度矩阵的rank为1时,

此时可观测量的概率分布完全由状态向量定义。当密度矩阵的秩不为1时,为混合态,可由两个互斥的投影矩阵A0,A1表示。

A0+A1=1,A0A1=0

根据定义

1tr(ρA0)=tr(ρA1)

该公式解释了为什么使用trace来计算向量空间中事件的概率。

2.4 RF based on quantum detection

中心思想:将query向量投影到基于量子计算的数学框架张成的向量空间中,进行变换修正。

公式证明:

xAi|xϕj|2=tr(Aiϕjϕj)

于是状态向量ϕj可以转化成密度矩阵ρ=ϕϕ

2.5 Connection:IR——QM

  • 相关性—— 文档状态,是一种二进制,相关或者不相关
  • 文档——粒子,具有状态向量
  • query——可观察量,投影

3.实验

4.自己的感悟

Tr(XTH1X)=ixiTH1xi

This line appears after every note.

Notes mentioning this note


Here are all the notes in this garden, along with their links, visualized as a graph.

Conda导出python环境加快访问github新闻稿实验1:ros入门实验3:自动驾驶实战实验4:ros2智能移动机器人实验5:ros1移动机器人动态避障(基于强化学习)实验6:轨迹跟踪仿真1最终实验自动驾驶辅助python函数Obsidian发布的免费替代方案Obsidian库解析TestYour first seedClip 串讲Nips'17 attention is all you needSigir'22 cret cross Modal retrieval transformer...Arxiv 2306’unifying large language models and...Arxiv'21 how much can clip benefit vision And...⭐ ⭐ ⭐ ⭐ ⭐ arxiv 2311' llmsurveychinese⭐⭐⭐⭐eccv'22 slip:self Supervision meets language...⭐⭐⭐⭐⭐clip:learning transferable visual models from...⭐⭐⭐⭐⭐icml'22 blip bootstrapping language Image pre...Arxiv'23 challenges and applications of large...Prl'20 retrieving quantum information with active...SIGIR'06 Laplacian Optimal Design for Image...Survey'09active learningTKDE'16Relevance Feedback Algorithms Inspired By...Improving interpretable embeddings for ad Hoc...Access'17...Artif. intell. rev.‘23 a survey on ensemble...Fcs'20 a survey on ensemble learningTpmai'04 asymmetric bagging and random subspace...⭐⭐⭐⭐access'22 a survey of ensemble learning进化集成学习算法综述《黑客与画家》 为什么书呆子不受欢迎《黑客与画家》《黑客与画家》——黑客与画家黑客伦理Avs检索流程Avs项目管理Avs speaker proposalAvs paper思路整理Presentation 思路整理Stable Diffusion检索流程2023avs交互使用flask快速构建浏览器实现图片交互Trecvid avs 个人感受2022交互情况统计2024avs交互情况统计Llm api测试Agi 比赛Lean(vs code)Agic TrickLlm相关论文Rtx 4090 部署大模型 20240306构建样题数据集调查开源大模型的数学能力想法计划231128调研Github下载Python调用javaVbs2024比赛复盘复现系统talkseeDiffusion扩散模型调研2023 mindspore量子计算黑客马拉松全国大赛热身题2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道代码集成进化算法Python使用Vscode使用Github问题Linux华为手机安装google框架工具推荐科研问题笔记本电脑视频生成调研20241002更换内存条(16g换到32g)24考研总结Reflection 大学四年的回顾及年终总结《周处除三害》观后感《奥本海默》观后感李沐讲座考研计划牛奶2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道排序融合动手学习深度学习算法笔记论文阅读模板2023 07 062023 08 30算法知识生活Paper ReadingProjects