Studies/Knowledges
Transformers in Vision (2) - ViT, Swin Transformer
Transformer가 computer vision에서 어떻게 쓰였는지, 관련 모델이 어떻게 발전하고 있는지 여러 포스팅에 걸쳐서 알아보고자 한다. Computer vision domain에서 Transformer를 사용하는 대표적인 아키텍쳐는 Vision Transformer(ViT, An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, Alexy et al., 2021)이고, 이를 보완한 것이 Swin Transformer(Swin Transformer: Hierarchical Vision Transformer Using Shifted Windows, Liu et al., 2021)이다. Computer vision에서..
2022. 11. 29. 19:07
최근댓글