【纯 Transformer 也可以取代 CNN 用于CV】Vision Transformer (ViT) 论文精读

原始题目 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 中文名称 一张图像等价于 16x16 Words: Transformers 来做大规模的图像识别 发表时间 2020年10月22日 平台
posted @ 2023-10-31 17:50  cold_moon  阅读(66)  评论(0编辑  收藏  举报