Представлено ViL - новий підхід xLSTM для комп'ютерного зору
Представлено Vision-LSTM (ViL), адаптацію xLSTM для комп'ютерного зору, яка демонструє високу ефективність, порівнянну з ViT та DeiT. Використовуються чергування бінаправлених блоків mLSTM для обробки зображень.
Це AI-дайджест. Матеріали згенеровано автоматично на основі відкритих джерел. Перевіряйте критичні рішення з профільним спеціалістом.