Associating multiple vision transformer layers for fine-grained image representation.

AllImages Videos Books Maps News Shopping

Search tools

Scholarly articles for Associating multiple vision transformer layers for fine-grained image representation.

scholar.google.com › citations

Transfg: A transformer architecture for fine-grained …
He · Cited by 438

… attention multi-scale transformer for fine-grained image …
Hu · Cited by 111

Feature fusion vision transformer for fine-grained visual …
Wang · Cited by 162

Associating multiple vision transformer layers for fine-grained image ...

www.sciencedirect.com › article › pii

We propose a novel network AMTrans, which efficiently increases layers to learn diverse features and utilizes integrated raw attention maps to capture more ...

Associating multiple vision transformer layers for fine-grained image ...

www.researchgate.net › ... › Vision

Associating multiple vision transformer layers for fine-grained image representation ; only image-level label are popular approaches ( ; and exibility of network ...

Adopting multiple vision transformer layers for fine-grained image ...

www.researchgate.net › ... › Vision

Oct 22, 2024 · Accurate discriminative regions proposal has an important effect for fine-grained image recognition. The vision transformer (ViT) brings ...

Associating multiple vision transformer layers for fine-grained image ...

ouci.dntb.gov.ua › works

Associating multiple vision transformer layers for fine-grained image representation. https://doi.org/10.1016/j.aiopen.2023.09.001. Journal: AI Open, 2023, p ...

A Simple Interpretable Transformer for Fine-Grained Image Classification ...

arxiv.org › cs

We present a novel usage of Transformers to make image classification interpretable. Unlike mainstream classifiers that wait until the last fully connected ...

LDH-ViT: Fine-grained visual classification through local ...

www.sciencedirect.com › article › abs › pii

3 days ago · Many methods based on Vision Transformer (ViT) have been proposed and applied in fine-grained visual classification (FGVC).

An Integrated Transformer with Collaborative Tokens Mining for ...

www.mdpi.com › ...

Jun 12, 2023 · Fine-grained recognition mainly classifies subclass images into hundreds of subcategorical labels by locating the discriminative regions ...

Delving into Multimodal Prompting for Fine-grained Visual Classification

arxiv.org › html

In this paper, we introduce MP-FGVC, a novel multimodal prompting solution designed to improve fine-grained visual classification.

[PDF] Multistage Attention Region Supplement Transformer for Fine ...

www.researchsquare.com › article

Jan 11, 2024 · This paper introduces a novel fine-grained visual classification model with Vision Transformer (ViT) as the backbone, namely Multistage ...

Token-Selective Vision Transformer for fine-grained image recognition ...

www.frontiersin.org › articles › full

Apr 25, 2023 · We propose TSVT, a novel Vision Transformer framework for fine-grained image classification of marine organisms that excludes background ...