Google представив нові моделі міжзорового сприйняття PaliGemma

ai_tech Стратегія, M&A, інвестиції AI-стартапи

14.04.2026, 11:18:31

Google анонсував нові відкриті моделі міжзорового сприйняття PaliGemma, які обробляють зображення та текст одночасно. Модель використовує кодувальник з SigLip-So400m для обробки зображень і Gemma-2B для генерації тексту, але не підходить для діалогового використання.

Читати оригінал: TG: AI HOUSE ↗

Це AI-дайджест. Матеріали згенеровано автоматично на основі відкритих джерел. Перевіряйте критичні рішення з профільним спеціалістом.