网易伏羲获CVPR 2023 UG2+、VizWiz大赛第一名，相关论文入选TIP

发布：2023-08-30 09:56:32

阅读：29048

作者：网易伏羲

近日，CVPR 2023赛果揭晓。网易伏羲实验室在CVPR 2023 UG2+Object Detection in Haze Challenge（雾霾目标识别挑战赛）、CVPR 2023 VizWiz Few-Shot Object Recognition Challenge（少样本目标识别挑战赛）两项赛事中斩获第一，相关论文入选国际顶级期刊TIP。网易伏羲在计算机视觉领域展现出的顶尖技术创新能力，得到国际范围内的高度认可。

网易伏羲实验室在CVPR 2023 UG2+Object Detection in Haze Challenge获得第一

网易伏羲在CVPR 2023 VizWiz Few-Shot Object Recognition Challenge获得第一

2023年2月至6月，计算机视觉顶会IEEE/CVF Computer Vision and Pattern Recognition Conference（国际计算机视觉与模式识别会议，简称：CVPR）联合全球权威学术机构和众多知名企业，共同举办了多项挑战赛。吸引了来自AI相关研究团队的广泛参与，并于近日陆续公布了获奖结果并颁发了获奖证书。CVPR是由IEEE主办的世界顶级AI学术会议，具有极高的学术影响力和社会认可度。

本次比赛中，网易伏羲同中国科学技术大学於俊老师团队合作，在CVPR 2023 UG2+Object Detection in Haze Challenge（雾霾目标识别挑战赛），CVPR 2023 VizWiz Few-Shot Object Recognition Challenge（少样本目标识别挑战赛）两项赛事中获得第一名。主要涉及计算机视觉中目标检测领域和少样本目标识别领域，可以应用于各个领域的视觉任务，其中少样本目标检测在工业应用中，尤其是在数据获取和标注困难的场景下具有重要的价值和意义。

UG2+旨在通过应用图像恢复和增强算法来提高分析性能，从而推进“困难”图像的分析。参与者的任务是开发新的算法，以改进在问题条件下捕获的图像的分析。VizWiz旨在让更多的人了解视力障碍患者的技术需求和兴趣，同时鼓励人工智能(AI)研究人员开发有助于消除无障碍障碍的新算法。比赛通常包括识别图像中的物体、识别图像中的文本以及回答有关图像的问题等任务。以下是网易伏羲本次获奖论文概述：

用于无监督异常检测的全频通道选择表示方法

Omni-frequency Channel-selection Representations for Unsupervised Anomaly Detection

关键词：无监督图像异常检测

异常检测是视觉图像理解中的一项重要任务，用于区分给定图像是否偏离预定义常态，在新颖性检测、基于工业图像的产品质量监控、缺陷自动修复、人体健康监测、视频监控等领域广泛应用。目前主要有三类主流的无监督异常检测方法：基于密度的方法、基于分类的方法、基于重建的方法。

其中，基于重构的方法由于重构能力差、性能不高而很少被提及，但其不需要额外花费大量的训练样本进行无监督训练，在工业应用中更加实用。为此，本研究着重改进基于重构的方法，提出了一种全新的全频通道选择重建网络（OCR-GAN），首创从频率的角度处理感官异常检测任务。大量的实验证明了该方法相对于其他方法的有效性和优越性。例如，在没有额外训练数据的情况下，在MVTec AD数据集上实现了新SOTA表现，AUC达到98.3，显著超过了基于重建的方法基线38.1和当前SOTA方法0.3。

论文涉及的技术突破可被有效应用于智能游戏兼容性测试。游戏兼容性测试旨在检测游戏代码在不同终端上执行的结果与预期是否一致，以确定游戏软件在不同硬件和软件环境下的兼容性。在所有兼容性测试问题中，UI异常占比约40%，如花屏、局部高光、黑边、材质丢失、异性屏遮挡等。不同于其他兼容性测试问题，UI异常一般不会体现在终端运行的日志中。也就是说，即使出现了UI异常问题，软件并不会报错，而是需要有一定测试经验的专业人员人工判断，费时费力。

论文对智能游戏兼容性测试的UI异常问题提出了创新型解决方案，借助AI技术来自动化检测游戏运行时出现的UI异常问题，实现自动化的游戏兼容测试。通过图像异常检测技术，从计算机视觉的角度，对游戏兼容性测试过程中生成的大量游戏界面截图进行自动化检测，得到UI异常图片，并辅助游戏开发人员快速、准确定位问题原因，从而有效地节省游戏测试专家的人力成本。

本篇论文与浙江大学刘勇老师团队合作，入选IEEE Transactions on Image Processing（TIP）。TIP系IEEE旗下图像处理研究领域的顶级期刊，中科院SCI一区期刊，中国计算机学会推荐的计算机图形学与多媒体领域A类期刊（CCF A），2022-2023年影响因子11.041。

计算机视觉人工智能

游戏人工智能：重塑虚拟世界的智慧生命体

在数字娱乐产业疾速演进的今天，游戏人工智能正突破传统代码逻辑的边界，通过赋予非玩家角色（NPC）情感认知、环境交互与战略决策能力，为玩家构建出兼具深度与广度的沉浸式体验。这场由算法驱动的进化，正在重新定义游戏世界的运行法则。

2025-04-03 17:47:09

游戏人工智能：开启智能互动新体验

游戏人工智能（Game AI）是指通过人工智能技术赋予非玩家角色（NPC）一定的智能，使其能够像人类玩家一样进行决策和行动。它本质上是人工智能技术在游戏领域的应用，旨在提升游戏的沉浸感和互动性。随着生成式AI技术的兴起，游戏AI正在经历一场智能革命，从传统的脚本化行为向更智能、更动态的交互发展。

2025-04-03 17:45:24

自然语言处理：开启智能交互新时代

自然语言处理（Natural Language Processing，NLP）是人工智能领域的重要分支，致力于使计算机能够理解、生成和处理人类的自然语言。其技术原理基于深度学习模型，尤其是循环神经网络（RNN）及其变体（如LSTM和GRU），以及近年来兴起的Transformer架构。这些模型通过大规模数据训练，学习语言的语法、语义和上下文关系，从而实现对自然语言的精准理解和生成。

2025-04-02 17:06:35

自然语言处理：解码人类语言的智能革命

在信息爆炸的数字时代，人类每天产生的文本数据量高达数亿兆字节，如何让机器理解并处理这些海量语言信息，成为推动人工智能发展的关键命题。自然语言处理（Natural Language Processing, NLP）作为人工智能领域的核心技术，正通过语义解析、情感分析和知识抽取等技术手段，逐步打破人机交互的语义壁垒。从智能手机的语音助手到跨国企业的智能客服，NLP正在重塑信息处理的基本范式。

2025-04-02 17:05:37

游戏AI：让虚拟世界更懂你的智能伙伴

你是否曾在游戏中遇到过“笨拙的电脑对手？或是被重复的关卡设计消磨了热情？这一切正在被游戏AI技术改变。从《塞尔达》中会合作围攻的怪物，到《动物森友会》里拥有记忆的邻居，游戏AI正悄悄让虚拟世界变得更生动、更懂人心。今天我们就来聊聊，这个藏在游戏幕后的“智能大脑”如何让我们的娱乐体验焕然一新。

2025-04-01 17:48:54

游戏AI：开启智能互动新体验

游戏AI是指通过人工智能技术赋予非玩家角色（NPC）一定的智能，使其能够像人类玩家一样进行决策和行动。它本质上是人工智能技术在游戏领域的应用，旨在提升游戏的沉浸感和互动性。随着生成式AI技术的兴起，游戏AI正在经历一场智能革命，从传统的脚本化行为向更智能、更动态的交互发展。

2025-04-01 17:44:12

具身智能：人工智能的新前沿

在人工智能领域，具身智能（Embodied Artificial Intelligence）正逐渐成为研究和应用的热点。具身智能强调智能体通过与物理环境的交互来获得智能，这一理念正在改变我们对人工智能的理解和应用方式。

2025-03-31 15:52:59

具身智能：打破虚实界限的下一代人工智能革命

在波士顿动力机器人流畅的后空翻动作中，在特斯拉Optimus人形机器人精准的抓取操作里，一个颠覆性技术范式正悄然崛起——具身智能（Embodied Intelligence）。这种将人工智能算法与物理实体深度结合的技术形态，正在重新定义人类对智能的认知边界。2024年MIT发布的《全球技术趋势报告》显示，具身智能领域的研发投入年增长率达47%，预示着这个领域即将引爆新一轮科技革命。

2025-03-31 15:52:00

人工智能技术应用：开启智能时代的新篇章

当今数字化浪潮席卷全球的今天，人工智能技术正以前所未有的速度融入并改变着我们的生活、工作以及各个行业的发展格局。从医疗健康到金融风控，从教育领域再到工业制造，人工智能技术应用的触角正不断向更广泛、更深层次延展，为社会的各个层面带来创新与变革的力量。

2025-03-28 16:47:12

人工智能技术应用：驱动未来发展的核心引擎

近年来，人工智能（AI）技术以颠覆性姿态渗透到各行各业，成为推动数字化转型的核心动力。从医疗诊断到智能制造，从金融风控到智慧农业，AI的应用场景不断拓展，深刻改变着人类社会的生产与生活方式。本文将深入探讨人工智能技术的主要应用领域及其带来的变革性影响。

2025-03-28 16:46:29