среда, 24 июня 2026 г.

OpenAI представляет Jalapeño — свой первый фирменный ИИ-чип

24 июня 2026 года OpenAI и Broadcom представили Jalapeño — первый «Intelligence Processor» OpenAI: кастомный ускоритель, спроектированный специально для инференса больших языковых моделей.

Физический образец чипа доставлен CEO Сэму Альтману и президенту Грегу Брокману лично CEO Broadcom Хоком Таном.

Что такое Jalapeño

Тип: ASIC (Application-Specific Integrated Circuit) для LLM inference

Архитектура: Спроектирован с нуля для современного инференса LLM, не адаптация существующих чипов

Техпроцесс: TSMC 3 нм

Производительность: По данным Bloomberg, экономия ~50% по сравнению с типичными AI GPU. По данным OpenAI, «substantially better performance per watt than current state-of-the-art»

Статус: Engineering samples работают в лаборатории на production target frequency и power, включая GPT-5.3-Codex-Spark

Скорость разработки

9 месяцев от дизайна до tape-out — OpenAI называет это возможно самым быстрым циклом разработки ASIC для высокопроизводительных полупроводников.

Как ускорили:

Глубокая software-hardware co-development с инженерами OpenAI

Экспертиза Broadcom в реализации кремния

Использование моделей OpenAI для ускорения процесса дизайна и оптимизации

Ричард Хо, руководитель аппаратного направления OpenAI (бывший инженер Google TPU): «Jalapeño был спроектирован с нуля для LLM inference с использованием детальных insights из нашего тесного сотрудничества с исследователями OpenAI. Мы оптимизировали архитектуру вокруг ядер, перемещения памяти, сетей и паттернов обслуживания, которые наиболее важны для frontier AI моделей.»

Архитектура

Ключевые оптимизации:

Сокращение перемещения данных (data movement)

Баланс compute, memory и networking ресурсов

Утилизация близкая к теоретическому пику производительности

Компоненты платформы:

OpenAI: дизайн чипа

Broadcom: реализация кремния, networking (включая Tomahawk silicon)

Celestica: платы, стойки, системная интеграция

TSMC: производство

Совместимость: Jalapeño спроектирован для работы со всеми LLM, не только моделями OpenAI.

Развертывание

Timeline:

Конец 2026: первое развертывание в прототипном масштабе

2027-2029: масштабирование до гигаваттных дата-центров

Партнеры: Microsoft и другие

Масштаб обязательств: 10 ГВт OpenAI-designed accelerators с Microsoft до конца 2029

Microsoft commitment: По данным The Information, Broadcom потребовала, чтобы Microsoft гарантировала покупку ~40% чипов для обеспечения первой фазы производства.

Контекст: путь к собственному чипу

Октябрь 2024: Reuters сообщает, что OpenAI совместно с Broadcom и TSMC работает над созданием первого собственного чипа

Начало 2025: Tape-out (финализация дизайна для производства)

Октябрь 2025: Официальное объявление о совместной разработке 10-гигаваттного ускорителя

Май 2026: The Information сообщает, что проект (кодовое название «Project Nexus») столкнулся с необходимостью привлечь $18 млрд финансирования для первой фазы

24 июня 2026: Публичная презентация Jalapeño

Команда: Под руководством Ричарда Хо выросла с ~20 до ~40 человек к tape-out

Зачем OpenAI собственный чип

Масштаб зависимости от Nvidia: OpenAI — один из крупнейших покупателей GPU Nvidia. Ежегодные расходы на чипы исчисляются миллиардами долларов.

Конкуренция за GPU: OpenAI конкурирует со всей AI-индустрией за ограниченные поставки Nvidia.

Оптимизация под свои задачи: ASIC менее гибкий, чем GPU, но дешевле и может быть оптимизирован под конкретные задачи.

Текущие мощности OpenAI: Более 2 ГВт, с обязательствами на ~33 ГВт через партнерства с Nvidia, AMD, Broadcom и Amazon.

Грег Брокман: «Jalapeño — часть нашей долгосрочной full-stack infrastructure стратегии, чтобы сделать compute более доступным. Проектируя больше стека самостоятельно, мы можем обслуживать больше интеллекта с большей эффективностью.»

Сравнение с конкурентами

Хок Тан, CEO Broadcom: Производительность Jalapeño сопоставима с чипами Nvidia серии Blackwell и тензорными процессорами Google.

Контекст:

Google: TPU (тензорные процессоры) с 2016 года

Amazon: Trainium и Inferentia

Meta: MTIA

OpenAI следует тому же пути — разработка фирменных чипов для снижения зависимости от Nvidia и оптимизации под свои workloads.

Риски для Nvidia

Startup Fortune: «Риск для Nvidia не в том, что Jalapeño побьет H100 или B200 в бенчмарках. Риск в том, что крупнейшие клиенты перестанут принимать одну default архитектуру для каждой задачи. Когда Google, Amazon, Microsoft, Meta и OpenAI все запустят серьезные custom silicon программы, ценовая власть Nvidia должна будет ответить на более сложный вопрос: почему каждый inference-доллар должен идти через general-purpose GPU stack?»

Применение

OpenAI в X: Jalapeño «создан специально для LLM-задач, обеспечивающих работу ChatGPT, Codex, API и будущих агентских продуктов.»

The Decoder отмечает: GPT-5.3-Codex-Spark сейчас работает на Cerebras hardware, который тоже специализируется на inference. Jalapeño может заменить эту зависимость.

Что дальше

Ближайшие месяцы: Детальный технический отчет о производительности

Конец 2026: Прототипное развертывание

2027+: Масштабирование с Microsoft и другими партнерами

Roadmap: Jalapeño — первый чип в многопоколенческой платформе. Broadcom и OpenAI планируют продолжать совместную разработку.

Итог

OpenAI представила свой первый кастомный чип для inference. Jalapeño спроектирован с нуля за 9 месяцев, обещает ~50% экономии по сравнению с GPU, и должен начать работу к концу 2026 года.

Это не замена Nvidia — OpenAI продолжит покупать GPU для training. Но это шаг к контролю над inference economics, где расходы растут с каждым пользователем ChatGPT.

Если Jalapeño работает как заявлено, OpenAI получает bargaining power над крупнейшей статьей расходов в AI-индустрии.

Источники

OpenAI — OpenAI and Broadcom unveil LLM-optimized inference chip

Broadcom — OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor

Bloomberg — OpenAI, Broadcom Unveil Jalapeno AI Chip Promising Faster, Cheaper Model Runs

OpenAI представляет Jalapeño — свой первый фирменный ИИ-чип

Что такое Jalapeño

Скорость разработки

Архитектура

Развертывание

Контекст: путь к собственному чипу

Зачем OpenAI собственный чип

Сравнение с конкурентами

Риски для Nvidia

Применение

Что дальше

Итог

Источники

Claude доказал гипотезу, которую люди не могли закрыть с 2014 года

Krea выпустила открытые веса Krea 2: Raw и Turbo

Маск придумал лучший бизнес в ИИ

DeepSeek V4 вышел и доступен бесплатно

Grok 4.3 научился выдавать готовые файлы

Eli Lilly заключила сделку с Insilico Medicine на $2.75 млрд для вывода AI-разработанных лекарств на глобальный рынок