再也不用预定义目标类别!YOLO-Word:检测任何目标!

作者:泡椒味的口香糖 | 来源:3DCV

在公众号「3DCV」后台,回复「原论文」可获取论文pdf、代码链接 

添加微信:dddvision,备注:目标检测,拉你入群

这篇文章提出了一种名为YOLO-World的高效实时开放词汇目标检测方法,旨在解决传统目标检测方法在开放场景中受预定义类别限制的问题。其核心思想是通过视觉语言建模和大规模数据集预训练,增强YOLO系列检测器对开放词汇的检测能力。主要实现方法是使用可重参数化的视觉语言路径聚合网络RepVL-PAN连接文本和图像特征,并引入基于区域的文本对比损失进行预训练,YOLO-World在LVIS数据集上实现了35.4的AP和52帧每秒的速度。

下面一起来阅读一下这项工作~

原文:再也不用预定义目标类别!YOLO-Word:检测任何目标!

图片

专业!3D视觉视频课程

3D视觉工坊精品课程官网:3dcver.com

我们的3D视觉学习平台包含:相位偏折术面结构光高阶结构光机械臂抓取工业点云实战Open3D深度学习缺陷检测3D缺陷检测BEV&OccTransformer模型部署3D目标检测单目深度估计车载标定规划与控制无人机三维视觉C++三维视觉pythondTOF相机标定ROS2机器人控制规划LeGo-LAOM激光-视觉-IMU-GPS融合SLAMLOAM-SLAM室内室外SLAMVINS-FusionORB-SLAM3MVSNet三维重建colmap线面结构光硬件结构光扫描仪

图片

▲长按扫码学习3D视觉精品课程

首个!国内3D视觉学习圈子

我们的3D视觉学习圈子「3D视觉从入门到精通」知识星球、国内成立时间最早、6000+成员交流学习。包括:星球专属课程近20门(价值超6000)项目对接3D视觉学习路线总结最新顶会论文&代码3D视觉行业最新模组3D视觉源码汇总书籍推荐编程基础&学习工具实战项目&作业求职招聘&面经&面试题等等。国内超一流3D视觉学习圈子!欢迎您扫码加入我们的学习圈子知识星球。

图片

▲长按扫码加入星球

重磅!3D视觉交流群

大家好,群里会第一时间发布3D计算机视觉方向的最前沿论文解读和交流分享,主要方向有:

视觉SLAM、激光SLAM、语义SLAM、NeRF-SLAM、路径规划、相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、阵列相机、光度立体视觉、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图、深度估计、Transformer、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、BEV感知、Occupancy、目标跟踪、四旋翼建模、无人机飞控、求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产群

添加微信: dddvision,备注:研究方向+学校/公司+昵称(如3D点云+清华+小草莓), 拉你入群。

图片

▲长按扫码添加助理

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>