华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务,ViG 在相似计算量情况下 Top-1 正确率达 82.1%,高于 ResNet 和 Swin Transformer。
论文链接:
https://arxiv.org/abs/2206.00272
PyTorch 代码:
https://github.com/huawei-noah/CV-Backbones
MindSpore 代码:
https://gitee.com/mindspore/models/tree/master/research/cv/ViG
视觉图神经网络 ViG 架构