OpenAI представляет Jalapeño — свой первый фирменный ИИ-чип

24 июня 2026 года OpenAI и Broadcom представили Jalapeño — первый «Intelligence Processor» OpenAI: кастомный ускоритель, спроектированный специально для инференса больших языковых моделей.
Физический образец чипа доставлен CEO Сэму Альтману и президенту Грегу Брокману лично CEO Broadcom Хоком Таном.
Что такое Jalapeño
Тип: ASIC (Application-Specific Integrated Circuit) для LLM inference
Архитектура: Спроектирован с нуля для современного инференса LLM, не адаптация существующих чипов
Техпроцесс: TSMC 3 нм
Производительность: По данным Bloomberg, экономия ~50% по сравнению с типичными AI GPU. По данным OpenAI, «substantially better performance per watt than current state-of-the-art»
Статус: Engineering samples работают в лаборатории на production target frequency и power, включая GPT-5.3-Codex-Spark
Скорость разработки
9 месяцев от дизайна до tape-out — OpenAI называет это возможно самым быстрым циклом разработки ASIC для высокопроизводительных полупроводников.
Как ускорили:
- Глубокая software-hardware co-development с инженерами OpenAI
- Экспертиза Broadcom в реализации кремния
- Использование моделей OpenAI для ускорения процесса дизайна и оптимизации
Ричард Хо, руководитель аппаратного направления OpenAI (бывший инженер Google TPU): «Jalapeño был спроектирован с нуля для LLM inference с использованием детальных insights из нашего тесного сотрудничества с исследователями OpenAI. Мы оптимизировали архитектуру вокруг ядер, перемещения памяти, сетей и паттернов обслуживания, которые наиболее важны для frontier AI моделей.»
Архитектура
Ключевые оптимизации:
- Сокращение перемещения данных (data movement)
- Баланс compute, memory и networking ресурсов
- Утилизация близкая к теоретическому пику производительности
Компоненты платформы:
- OpenAI: дизайн чипа
- Broadcom: реализация кремния, networking (включая Tomahawk silicon)
- Celestica: платы, стойки, системная интеграция
- TSMC: производство
Совместимость: Jalapeño спроектирован для работы со всеми LLM, не только моделями OpenAI.
Развертывание
Timeline:
- Конец 2026: первое развертывание в прототипном масштабе
- 2027-2029: масштабирование до гигаваттных дата-центров
Партнеры: Microsoft и другие
Масштаб обязательств: 10 ГВт OpenAI-designed accelerators с Microsoft до конца 2029
Microsoft commitment: По данным The Information, Broadcom потребовала, чтобы Microsoft гарантировала покупку ~40% чипов для обеспечения первой фазы производства.
Контекст: путь к собственному чипу
Октябрь 2024: Reuters сообщает, что OpenAI совместно с Broadcom и TSMC работает над созданием первого собственного чипа
Начало 2025: Tape-out (финализация дизайна для производства)
Октябрь 2025: Официальное объявление о совместной разработке 10-гигаваттного ускорителя
Май 2026: The Information сообщает, что проект (кодовое название «Project Nexus») столкнулся с необходимостью привлечь $18 млрд финансирования для первой фазы
24 июня 2026: Публичная презентация Jalapeño
Команда: Под руководством Ричарда Хо выросла с ~20 до ~40 человек к tape-out
Зачем OpenAI собственный чип
Масштаб зависимости от Nvidia: OpenAI — один из крупнейших покупателей GPU Nvidia. Ежегодные расходы на чипы исчисляются миллиардами долларов.
Конкуренция за GPU: OpenAI конкурирует со всей AI-индустрией за ограниченные поставки Nvidia.
Оптимизация под свои задачи: ASIC менее гибкий, чем GPU, но дешевле и может быть оптимизирован под конкретные задачи.
Текущие мощности OpenAI: Более 2 ГВт, с обязательствами на ~33 ГВт через партнерства с Nvidia, AMD, Broadcom и Amazon.
Грег Брокман: «Jalapeño — часть нашей долгосрочной full-stack infrastructure стратегии, чтобы сделать compute более доступным. Проектируя больше стека самостоятельно, мы можем обслуживать больше интеллекта с большей эффективностью.»
Сравнение с конкурентами
Хок Тан, CEO Broadcom: Производительность Jalapeño сопоставима с чипами Nvidia серии Blackwell и тензорными процессорами Google.
Контекст:
- Google: TPU (тензорные процессоры) с 2016 года
- Amazon: Trainium и Inferentia
- Meta: MTIA
OpenAI следует тому же пути — разработка фирменных чипов для снижения зависимости от Nvidia и оптимизации под свои workloads.
Риски для Nvidia
Startup Fortune: «Риск для Nvidia не в том, что Jalapeño побьет H100 или B200 в бенчмарках. Риск в том, что крупнейшие клиенты перестанут принимать одну default архитектуру для каждой задачи. Когда Google, Amazon, Microsoft, Meta и OpenAI все запустят серьезные custom silicon программы, ценовая власть Nvidia должна будет ответить на более сложный вопрос: почему каждый inference-доллар должен идти через general-purpose GPU stack?»
Применение
OpenAI в X: Jalapeño «создан специально для LLM-задач, обеспечивающих работу ChatGPT, Codex, API и будущих агентских продуктов.»
The Decoder отмечает: GPT-5.3-Codex-Spark сейчас работает на Cerebras hardware, который тоже специализируется на inference. Jalapeño может заменить эту зависимость.
Что дальше
Ближайшие месяцы: Детальный технический отчет о производительности
Конец 2026: Прототипное развертывание
2027+: Масштабирование с Microsoft и другими партнерами
Roadmap: Jalapeño — первый чип в многопоколенческой платформе. Broadcom и OpenAI планируют продолжать совместную разработку.
Итог
OpenAI представила свой первый кастомный чип для inference. Jalapeño спроектирован с нуля за 9 месяцев, обещает ~50% экономии по сравнению с GPU, и должен начать работу к концу 2026 года.
Это не замена Nvidia — OpenAI продолжит покупать GPU для training. Но это шаг к контролю над inference economics, где расходы растут с каждым пользователем ChatGPT.
Если Jalapeño работает как заявлено, OpenAI получает bargaining power над крупнейшей статьей расходов в AI-индустрии.