Google выложили Gemma 4 - новую линейку открытых моделей, которые можно гонять локально, в том числе на не самом мощном железе. Судя по описанию, есть большие варианты (26B и 31B параметров) и отдельные маленькие версии под устройства.
Из интересного: модель обучали на куче языков (говорят, до 140), плюс она не только «про текст» - заявлена мультимодальность (картинки) и нормальная работа с логикой и агентными сценариями.
Отдельно упоминают варианты E2B и E4B - они заточены под распознавание речи и всякие истории типа умного дома. В теории это выглядит как удобный вариант для локального ассистента без облака.
Но пока непонятно, насколько это всё реально «на тостере», а где уже нужны нормальные GPU/квантование и пляски с настройками. И ещё интересно, как у неё с русским вживую: не только понимать, но и стабильно держать контекст без галлюцинаций.
Страница коллекции на Hugging Face: Gemma 4.
Кто уже пробовал запускать? Как по качеству по сравнению с Gemma 2/3 и другими открытыми моделями, особенно на русском и в мультимодальности?
