Vbs2024比赛复盘

KIS-V

  • 在我们以为结束之前,我们处于所有队伍的二三名次。在marine和V3C上我们都做的很好,就是LHE的题目比较难,我们一道也没做对,但其他队伍在这个数据集上也很少得分。
  • 建议marine和LHE可以考虑1秒切1帧(marine是小数据集,LHE的精度明显不够)

image.png

  • 自动化上再提高,比如我感觉左键设置开始时间右键设置结束时间明显比点击悬停的“S”“E”按钮会快很多。

image.png

KIS-T

  • 成绩在中下游水平
  • 目前主要依靠算法。简单的题目在第一次给出信息时候,排名靠前就有答案。大部分难的题目需要修改官方给的query,去猜哪些元素在画面中占比较小可以忽略/哪些元素占比较大需要重点关注。e.g.
    We see a girl in a dark dress pushing the door of a convenience store, after it closes, she runs away. There are two bikes and four trash cans in front of the shop windows. The store's brand colors are green, white and  blue.
    如何想象图片,告诉model,给句子加权
    搜第一句话离答案很远,最后看视频才知道是小女孩太小了
    
  • 搜索第一句话时: image.png

  • 搜索倒数两句话时 image.png

  • 最终正确答案 image.png

  • 驴子 和 赛车 答案和我们提交的片段很像。

  • 参考一下得分较高的队伍的系统功能,比如temporary search。(有些队伍(vibro、VISIONE)在我们觉得很难的题目也能很快提交)

AVS

  • 每个视频只出现一帧。后续考虑能够刷新看到排在后面的图片。目前只能看到前350
  • 策略:不求数量,只求符合描述。
  • 改进:类似KIS-T加入往年队伍的新功能
  • 现象:题目简单大家都交的多,题目难只有一个对的。比如下面这道题
    Find shots of a person opening a beverage can(e.g. beer or soda), and with liquid being spilled.(翻译的时候我们认为是饮料洒了,结果交正常倾倒饮料罐的图片被判对了)
    

    image.png

QA

  • 强烈要求加入播放视频的功能!!!
  • 判题:就算你答对了也会判错,从根本上杜绝多个子系统有预谋地通过试答案垫高某一个主系统的分数。(对我们来说就是没法知道到底做对没有)
  • 很难,根本没有可能单凭官方给出的视频片段找到答案。大部分都要找到视频,去视频的前后文或者语音里找答案。

远程连接

  • 向日葵远程连接,可以用来录屏,网速也还可以
  • 中途有段时间我这边的键盘输入没法同步到那边,导致ctrl键和windows键用不了。用一些需要快速复制粘贴和截屏的操作不能做,只能用鼠标点,有些题目没做好。重启向日葵能解决。
  • 公布题目的网站到我们这里有延迟,大概在1000ms-8000ms。最好是直接在zoom会议里进行截图,那里延迟最低。

其他

  • Novice task线上的队伍不用参加,是现场找新手来使用你的系统。

This line appears after every note.

Notes mentioning this note


Here are all the notes in this garden, along with their links, visualized as a graph.

Conda导出python环境加快访问github新闻稿实验1:ros入门实验3:自动驾驶实战实验4:ros2智能移动机器人实验5:ros1移动机器人动态避障(基于强化学习)实验6:轨迹跟踪仿真1最终实验自动驾驶辅助python函数Obsidian发布的免费替代方案Obsidian库解析TestYour first seedClip 串讲Nips'17 attention is all you needSigir'22 cret cross Modal retrieval transformer...Arxiv 2306’unifying large language models and...Arxiv'21 how much can clip benefit vision And...⭐ ⭐ ⭐ ⭐ ⭐ arxiv 2311' llmsurveychinese⭐⭐⭐⭐eccv'22 slip:self Supervision meets language...⭐⭐⭐⭐⭐clip:learning transferable visual models from...⭐⭐⭐⭐⭐icml'22 blip bootstrapping language Image pre...Arxiv'23 challenges and applications of large...Prl'20 retrieving quantum information with active...SIGIR'06 Laplacian Optimal Design for Image...Survey'09active learningTKDE'16Relevance Feedback Algorithms Inspired By...Improving interpretable embeddings for ad Hoc...Access'17...Artif. intell. rev.‘23 a survey on ensemble...Fcs'20 a survey on ensemble learningTpmai'04 asymmetric bagging and random subspace...⭐⭐⭐⭐access'22 a survey of ensemble learning进化集成学习算法综述《黑客与画家》 为什么书呆子不受欢迎《黑客与画家》《黑客与画家》——黑客与画家黑客伦理Avs检索流程Avs项目管理Avs speaker proposalAvs paper思路整理Presentation 思路整理Stable Diffusion检索流程2023avs交互使用flask快速构建浏览器实现图片交互Trecvid avs 个人感受2022交互情况统计2024avs交互情况统计Llm api测试Agi 比赛Lean(vs code)Agic TrickLlm相关论文Rtx 4090 部署大模型 20240306构建样题数据集调查开源大模型的数学能力想法计划231128调研Github下载Python调用javaVbs2024比赛复盘复现系统talkseeDiffusion扩散模型调研2023 mindspore量子计算黑客马拉松全国大赛热身题2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道代码集成进化算法Python使用Vscode使用Github问题Linux华为手机安装google框架工具推荐科研问题笔记本电脑视频生成调研20241002更换内存条(16g换到32g)24考研总结Reflection 大学四年的回顾及年终总结《周处除三害》观后感《奥本海默》观后感李沐讲座考研计划牛奶2023 mindspore量子计算黑客马拉松初赛——量子组合优化赛道排序融合动手学习深度学习算法笔记论文阅读模板2023 07 062023 08 30算法知识生活Paper ReadingProjects