Коротко: Google выпустила Gemma 4 — открытую модель, которую можно скачать и запустить прямо на своём компьютере или телефоне. Она бесплатна, работает без интернета и не отправляет данные в облако, поэтому подходит для чувствительной информации. Ниже — что умеет Gemma 4, какой из четырёх размеров выбрать, как её запустить и где это реально нужно бизнесу, а где нет.
Привычная картина работы с ИИ — это подписка на ChatGPT или Claude, интернет и чужой сервер, на который уходит каждый ваш запрос. Gemma 4 ломает эту схему: модель Google, которую вы скачиваете один раз и запускаете на своём железе. Без подписки, без интернета, без отправки данных наружу.
Звучит как игрушка для энтузиастов, но для бизнеса тут спрятаны три вещи, которые стоят денег и нервов: бесплатность, автономность и конфиденциальность. Мы в ЭПОХА\ИИ разворачиваем локальные модели для клиентов, которым нельзя выпускать данные в облако, поэтому разберём Gemma 4 не как гик-новинку, а как рабочий инструмент.
Что такое Gemma 4 и чем «открытая модель» отличается от ChatGPT
Gemma 4 — семейство открытых моделей от Google, выпущенное в апреле 2026 года. Построено оно на тех же исследованиях, что и флагманский Gemini 3, но устроено принципиально иначе с точки зрения доступа.
ChatGPT и Claude — закрытые облачные модели: вы отправляете запрос на сервер компании, там его обрабатывают и присылают ответ. Gemma 4 — это открытые веса (open weight): сами файлы модели лежат в открытом доступе, вы скачиваете их и запускаете у себя. Лицензия — Apache 2.0, то есть использовать можно и в коммерческих проектах.
Важный нюанс, который часто путают: открытые веса — это не то же самое, что полностью открытый исходный код. В open source открыты ещё и код обучения, и данные. Здесь открыты именно веса — готовая модель, которую можно запускать на своём оборудовании без оглядки на чужие лимиты. Для бизнеса это и есть главное: модель ваша, работает там, где скажете.
Три причины, почему «локально» — это серьёзно для бизнеса
Запуск на своём устройстве — не гиковская придирка, а три конкретных выгоды.
Бесплатно. Никакой подписки, никакой платы за каждый запрос. Скачали модель — пользуетесь сколько угодно. Для команды, которая гоняет ИИ на потоке, это снимает ежемесячный счёт за токены.
Работает без интернета. Модель лежит у вас на диске, поэтому отвечает даже в самолёте, на объекте без связи или при упавшем провайдере. Облачный ChatGPT в этих условиях просто не открывается.
Данные не уходят наружу. Всё считается на вашем устройстве, ничего не отправляется на внешний сервер. Для работы с персональными данными клиентов, договорами, медицинской или финансовой информацией это решающий аргумент. Оговорка: перед внедрением всё равно согласуйте подход со своей службой безопасности — у каждой компании свои правила, но сама архитектура даёт прочную основу.
Локальная модель — это редкий случай, когда бесплатный вариант ещё и безопаснее платного. Данные остаются на вашем железе, а не на сервере чужой компании. Для бизнеса с требованиями к локализации данных это часто единственный допустимый путь.
Что умеет Gemma 4
По возможностям это не урезанная «версия для бедных», а полноценная современная модель.
- Мультимодальность. Понимает не только текст, но и изображения, видео и аудио. То есть может разобрать документ со сканами, ответить по картинке или расшифровать запись.
- 140+ языков. Русский в их числе, причём поддержка заявлена как одна из сильных сторон семейства.
- Контекст до 256 тысяч токенов. Можно загрузить большой документ целиком и работать с ним, не теряя начало к середине.
- Уровень Gemini 3. Модель построена на тех же исследованиях, что и облачный флагман Google, поэтому по качеству она в верхней группе среди открытых моделей.
Сопоставимого уровня среди открытых моделей достигают разве что Qwen 3.5, GLM 5 и Kimi K2.5 — но они тяжелее и для нормальной работы требуют серверного железа, а не домашнего ПК. Gemma 4 в этом смысле выгодно отличается: сильная модель, которая помещается на обычное устройство.
Четыре размера — какой выбрать
Gemma 4 вышла в четырёх размерах. Размер — это сколько параметров модель задействует при работе: чем больше, тем «умнее» ощущается ответ, но тем мощнее нужно железо.
| Размер | Под какое устройство |
|---|---|
| E2B (эффективные 2 млрд) | Телефон, слабый ноутбук. Экономит память и батарею. |
| E4B (эффективные 4 млрд) | Телефон помощнее, обычный ноутбук. Оптимальный баланс для большинства. |
| 26B MoE (Mixture of Experts) | Сильный ПК с хорошей видеокартой. |
| 31B Dense | Топовый ПК или рабочая станция, максимум качества. |
Модели E2B и E4B специально сделаны «лёгкими»: они активируют небольшой объём параметров при работе, чтобы беречь оперативную память и заряд. Поэтому Gemma 4 запускается даже на телефоне, Raspberry Pi или мини-компьютере вроде NVIDIA Jetson — почти без задержки.
Начинать стоит с E4B — это лучший баланс «умная, но не требует сервера». Если ответы кажутся слабоватыми и есть мощная видеокарта — переходите на 26B или 31B. На телефоне берите E2B или E4B.
Как запустить — на компьютере и на телефоне
Скачать и запустить Gemma 4 проще, чем кажется. Программировать не нужно.
На компьютере. Поставьте бесплатную программу для локального запуска моделей — например, LM Studio или Ollama. Внутри находите Gemma 4, выбираете нужный размер, скачиваете — и общаетесь в окне чата, как с привычным ИИ. Сами файлы модели также лежат в открытом доступе на Hugging Face. Для квантованных (облегчённых) версий хватает обычной потребительской видеокарты, и их же можно подключать к редакторам кода и ИИ-ассистентам.
На телефоне. Есть приложения для локального запуска моделей прямо на смартфоне — туда ставятся облегчённые размеры E2B и E4B. Модель работает офлайн, без передачи данных в сеть.
Весь путь — от установки программы до первого ответа — занимает минут пятнадцать, и почти всё это время уходит на загрузку файлов модели. Как соотносятся облачные Gemini, GPT и Claude между собой по задачам, мы разбирали в отдельном материале — GPT против Gemini против Claude; Gemma 4 — это локальная «младшая родня» Gemini, со своей нишей.
ИИ-стек на ваших серверах
Где Gemma 4 подходит бизнесу, а где нет
Чтобы не было завышенных ожиданий — честно про границы.
Где заходит:
- Обработка чувствительных данных, которые нельзя выпускать в облако: договоры, персональные данные, медицина, финансы.
- Автономные сценарии без стабильного интернета — выезды, производство, удалённые объекты.
- Массовая рутина без счёта за токены: классификация, извлечение данных, черновые тексты, расшифровки.
- Встраивание ИИ в собственные продукты и инфраструктуру, где не хочется зависеть от чужого API. По похожей логике многие выбирают экономичные модели — мы разбирали это на примере DeepSeek для бизнеса.
Где не стоит:
- Самые сложные задачи на пределе возможностей ИИ. Облачные топ-модели (Gemini 3, Claude Opus, GPT-5) на тяжёлом рассуждении и большом коде всё ещё сильнее.
- Если у вас нет подходящего железа. Большие размеры требуют хорошей видеокарты, а на слабом ноутбуке тяжёлая модель будет думать долго.
- Когда нужна готовая инфраструктура «из коробки» с поддержкой — локальный запуск это всё-таки про самостоятельность или про внедрение через подрядчика.
Локальная модель не освобождает от ответственности за данные. Перед тем как пускать в неё реальную клиентскую или медицинскую информацию, согласуйте это со своей службой безопасности — архитектура помогает, но финальные правила за вами.
Gemma 4 не заменяет облачные флагманы на самых сложных задачах. Но там, где важнее цена, автономность и контроль над данными, бесплатная модель, которая живёт на вашем железе, бьёт подписку по всем трём пунктам сразу.
Источники
- Gemma 4 — анонс Google (проверено: май 2026) — размеры, мультимодальность, дата релиза
- Gemma 4 model card — Google AI for Developers (проверено: май 2026) — технические характеристики, контекст, языки
- Gemma 4 в LM Studio (проверено: май 2026) — локальный запуск на компьютере
FAQ
Gemma 4 правда полностью бесплатна?
Да. Это модель с открытыми весами под лицензией Apache 2.0 — вы скачиваете файлы и запускаете на своём оборудовании без подписки и платы за запросы. Платить нужно только за электричество и, при необходимости, за более мощное железо.
Чем открытые веса отличаются от открытого кода?
Открытые веса — это сами файлы готовой модели, доступные для скачивания и запуска. Открытый исходный код — это ещё и код обучения с данными. У Gemma 4 открыты веса: для использования этого достаточно, вы запускаете модель у себя без ограничений со стороны разработчика.
Какой размер выбрать?
Для телефона и слабого ноутбука — E2B или E4B. Для большинства задач на обычном компьютере оптимален E4B. Если есть мощная видеокарта и нужно максимальное качество — берите 26B MoE или 31B Dense. Начать проще с E4B и при необходимости перейти выше.
Безопасно ли работать с конфиденциальными данными?
Архитектурно — да, потому что всё считается локально и ничего не уходит на внешние серверы. Это сильная сторона Gemma 4. Но перед запуском реальных клиентских или медицинских данных согласуйте подход со своей службой безопасности — у каждой компании свои регламенты.
Gemma 4 заменит ChatGPT или Claude?
Не на всех задачах. На самом сложном рассуждении и больших проектах облачные флагманы пока сильнее. Но там, где важнее бесплатность, работа без интернета и приватность данных, Gemma 4 закрывает потребность полностью и без ежемесячного счёта.
Что нужно, чтобы запустить её на компьютере?
Бесплатная программа для локального запуска моделей — например, LM Studio или Ollama. В ней находите Gemma 4, выбираете размер, скачиваете и пользуетесь в окне чата. Для больших размеров пригодится хорошая видеокарта, лёгкие версии работают и на обычном железе.
Прочитали? Давайте внедрим
ИИ-консультант ответит за 5 секунд.