图像分析AI系统YOLO新版本为计算机视觉应用带来更大可能性

计算机视觉为机器提供了眼睛,使它们能够像人类一样看待世界。开源的图像分析 AI 系统YOLO的v8版本展示了当前最新的技术成就,能够更快、更准确识别场景中的更多对象并显示当前的技术状态,这为应用场景带来了更大的可能性。

YOLO最初于2015年推出,内置了对对象检测、实例分割和图像分类的支持,可以在商用计算机硬件上运行。与以前的YOLO版本相比,YOLOv8在图像分割和对象检测方面有重大进步,特别是在较弱的硬件上运行的更紧凑的版本。例如,最小的 YOLOv8 模型在基准测试中识别的对象比最小的 YOLOv5 版本多 30%。

计算机视觉系统检测和跟踪环境中的对象越多、更快、功能越强大、越可靠,应用场景就越有可能,例如,对于需要导航和了解环境的日常机器人和AR头显。

YOLOv8 已于2023 年 1 月 10 日发布,有五个版本。最小的模型Nano的平均对象识别精度(mAP)值为37.3,最大的型号Xtra Large为53.9。mAP 值是计算机视觉中用于评估对象识别算法性能的常用指标,指的是算法正确检测对象并将其与误报区分开来的程度。较高的 mAP 值通常意味着更好的性能。

自从OpenAI的DALL-E 2和GPT-3发布以来,关于AI进步的讨论多半集中在图像和语言模型上。但YOLOv8表明,机器视觉也在不断发展并变得更加强大。这可能比语言和图像系统对我们的日常生活产生同样多甚至更大的影响,包括乌托邦式的反乌托邦式的,前者如自动驾驶汽车,后者则有无处不在的监控、自动战争等。

YOLO在功能上反乌托邦性质也为它的研发历程带来过波折。最初的开发人员 Joe Redmon 于 2020 年停止了在该如软件上的工作,因为他不能忽视YOLO在军事或监视应用中的潜在滥用。自v3版本起,YOLO由计算机社区接手继续开发。最新版本v8来自Ultralytics,该公司与美国情报界(IC)和美国国防部(DoD)等机构合作。

YOLOv8 在 Github 上免费提供,允许用于开源项目和学术应用程序。在商业项目上使用,需要付费获得Ultralytics的许可。【转自反讽机器

赞赏支付宝扫码赞赏微信扫码赞赏
本文系最元宇宙原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

相关文章

毕昂
毕昂
继续