內湖分店 新店分店 中和分店 法拍部 商務中心 

英偉達被撬牆角:OpenAI首次發布Cerebras晶片支持模型

    OpenAI正在減少對英偉達的依賴,本周四發布了首個運行在Cerebras Systems晶片上的AI模型,標誌著這家AI明星在供應商多元化策略上邁出關鍵一步。此舉正逢OpenAI與英偉達關係微妙,雙方去年秋季宣布的千億美元合作如今據稱陷入停滯。

    GPT-5.3-Codex-Spark專為實時編碼設計,是OpenAI最新代碼自動化軟體Codex的精簡版,旨在提供更快響應速度以換取部分性能。OpenAI稱該模型生成速度比前代產品快15倍,每秒可輸出超過1000個token。這是OpenAI 2026年1月與Cerebras簽署超過100億美元協議後的首個成果。

    該模型率先向ChatGPT Pro訂閱用戶開放研究預覽版,並通過Codex應用、命令行介面和Visual Studio Code擴展提供服務。OpenAI表示,Codex目前擁有超過100萬周活躍用戶,過去十天下載量超過100萬次。

    這一發布凸顯了OpenAI在AI編碼助手市場的競爭壓力。該公司正面臨來自谷歌、Anthropic等對手的激烈競爭,同時還需應對內部安全團隊解散、研究人員離職以及在ChatGPT中引入廣告等爭議。

    速度提升伴隨性能妥協

    Codex-Spark代表OpenAI首個專為實時編碼協作打造的模型。該公司聲稱生成速度提升15倍,但拒絕提供具體延遲指標,如首token時間或每秒token數。

    "我們無法分享具體延遲數字,但Codex-Spark經過優化,能夠提供近乎即時的感受——在保持真實編碼任務高度能力的同時,實現15倍更快的生成速度,"OpenAI發言人表示。

    這種速度提升以能力妥協為代價。在SWE-Bench Pro和Terminal-Bench 2.0這兩個評估AI系統自主執行複雜軟體工程任務能力的行業基準測試中,Codex-Spark的表現不及完整版GPT-5.3-Codex模型。OpenAI將此定位為可接受的權衡:開發者能夠獲得足夠快的響應以保持創作流暢性,即使底層模型無法處理最複雜的多步驟編程挑戰。

    該模型配備128000個token的上下文窗口,僅支持文本輸入,不支持圖像或多模態輸入。小部分企業合作夥伴將獲得API訪問權限以評估集成可能性。OpenAI計劃在未來幾周根據實際工作負載調整後擴大訪問範圍。

    Cerebras硬體消除傳統GPU集群瓶頸

    Codex-Spark背後的技術架構反映出推理經濟學在AI公司擴展面向消費者產品時日益重要。Cerebras的第三代晶圓級引擎是一塊約餐盤大小的單晶片,包含4萬億個電晶體,消除了AI工作負載分散到多個小型處理器集群時產生的大量通信開銷。

    對於訓練大規模模型,分布式方法仍然必要,英偉達GPU在此表現出色。但對於推理——即生成用戶查詢響應的過程——Cerebras認為其架構可以以顯著更低的延遲交付結果。Cerebras首席技術官兼聯合創始人Sean Lie將這一合作視為重塑開發者與AI系統交互方式的機會。

    "GPT-5.3-Codex-Spark最令我們興奮的是與OpenAI及開發者社區合作,探索快速推理帶來的可能性——新的交互模式、新的用例,以及根本不同的模型體驗,"Lie在聲明中表示。"這次預覽僅僅是開始。"

    OpenAI的基礎設施團隊並未將優化工作局限於Cerebras硬體。該公司宣布在整個推理堆棧中實現延遲改進,使所有Codex模型受益,包括持久WebSocket連接和Responses API內的優化。結果顯示:每次客戶端-伺服器往返開銷減少80%,每token開銷減少30%,首token時間減少50%。

    與英偉達千億美元協議似乎停滯

    鑒於OpenAI與英偉達之間日益複雜的關係,Cerebras合作意義重大。

    2025年9月,英偉達與OpenAI宣布簽署意向書確立達成戰略合作,OpenAI將利用英偉達的系統打造和部署至少10千兆瓦(GW)的AI數據中心,使用數百萬塊英偉達的圖形處理器(GPU)訓練和部署OpenAI的下一代AI模型,英偉達則計劃對OpenAI投資最高1000億美元。這是英偉達迄今為止做出的最大手筆投資承諾。

    以上戰略合作聲明似乎鞏固了全球最有價值AI公司與主導晶片供應商之間的戰略聯盟。

    五個月後,據多個報導,上述巨額交易已實質性停滯。英偉達CEO黃仁勛公開否認存在緊張關係,1月下旬告訴記者"沒有戲劇性",英偉達仍致力於參與OpenAI當前融資輪。但雙方關係已明顯降溫,評論認為摩擦源於多個方面。

    OpenAI積極尋求與替代晶片供應商的合作,包括與Cerebras的交易以及分別與AMD和博通簽署協議。2025年10月,OpenAI與英偉達競爭對手AMD達成重磅協議,將在多年內部署6GW的AMD GPU。同月晚些時候,OpenAI同意從博通購買定製晶片和網絡組件。

    從英偉達角度看,OpenAI可能正在利用其影響力將使其AI突破成為可能的硬體商品化。從OpenAI角度看,減少對單一供應商的依賴代表著審慎的商業策略。

    OpenAI發言人本周四告訴媒體,“將繼續與生態系統合作,持續評估所有用例中性價比最高的晶片”,“對於研究和推理等對成本敏感且以吞吐量為先的應用場景,GPU 仍然是我們的首選。”

    這一聲明體現出避免激怒英偉達同時保留靈活性的謹慎努力,也反映出訓練前沿AI模型仍需要英偉達GPU提供的大規模並行處理能力。

    OpenAI發言人在周四的聲明中表示,OpenAI與英偉達的合作關係是“基礎性的”,OpenAI最強大的AI模型是兩家公司“多年來在硬體和軟體工程方面並肩合作”的結果。“這就是為什麼我們將英偉達作為訓練和推理堆棧的核心,同時通過與Cerebras、AMD和博通的合作有意擴展其周圍的生態系統。”

    內部動盪加劇外界審視

    Codex-Spark發布之際,OpenAI正應對一系列內部挑戰,加劇了外界對該公司方向和價值觀的審視。據本周報導,OpenAI解散了其使命對齊團隊,該團隊於2024年9月成立,旨在推動公司確保通用人工智慧造福人類的既定目標。團隊七名成員已被重新分配到其他崗位,負責人Joshua Achiam獲得"首席未來學家"的新頭銜。

    OpenAI此前在2024年解散了另一個關注安全的團隊——超級對齊團隊,該團隊專注於AI帶來的長期存在性風險。解散安全導向團隊的模式招致研究人員批評,他們認為OpenAI的商業壓力正在壓倒其最初的非營利使命。

    該公司還面臨在ChatGPT中引入廣告決定帶來的後果。研究員Zoë Hitzig本周因她所描述的廣告支持AI的"滑坡效應"而辭職,在《紐約時報》撰文警告稱,ChatGPT存檔的親密用戶對話記錄為操縱創造了前所未有的機會。Anthropic在超級碗廣告中趁機打出標語:"廣告正進入AI。但不會進入Claude。"

    另外,該公司同意通過Genai.mil向五角大樓提供ChatGPT,這是美國國防部的新項目,要求OpenAI允許"所有合法使用"而不受公司施加的限制——據報導Anthropic拒絕了這些條款。還有報導稱,曾對計劃中的露骨內容功能表達擔憂的OpenAI產品政策副總裁Ryan Beiermeister在1月份因歧視指控被解僱,她否認該指控。

    AI編碼助手市場競爭加劇

    儘管周圍動盪不安,OpenAI針對Codex的技術路線圖仍顯示出雄心勃勃的計劃。OpenAI設想推出一種編碼助手,能夠無縫融合快速交互式編輯與長期運行的自主任務——一個既能處理快速修復,又能同時協調多個代理在後台處理更複雜問題的AI。

    OpenAI發言人告訴媒體:“隨著時間推移,這些模式將融合——Codex可以讓你保持緊密的交互循環,同時將長期運行的工作委派給後台子代理,或者在你需要廣度和速度時將任務並行分配給多個模型,這樣你就不必預先選擇單一模式。”

    這一願景不僅需要更快的推理速度,還需要複雜的任務分解以及不同規模和能力模型之間的協調。Codex-Spark為該體驗的交互部分建立了低延遲基礎;未來版本需要提供自主推理和多代理協調能力,才能實現完整願景。

    目前,Codex-Spark採用與其他OpenAI模型分開的速率限制,反映出研究預覽期間Cerebras基礎設施容量受限。"因為它運行在專門的低延遲硬體上,使用受單獨速率限制管控,在研究預覽期間可能根據需求調整,"發言人指出。這些限制被設計為"慷慨的",OpenAI在決定如何擴展時監控使用模式。

    Codex-Spark的發布正值AI驅動開發工具激烈競爭之際。Anthropic的Claude Cowork產品上周引發傳統軟體股拋售,因投資者考慮AI助手是否可能取代傳統企業應用。微軟、谷歌和亞馬遜繼續在與各自雲平臺集成的AI編碼能力上大舉投資。

    OpenAI的Codex應用自推出十天以來展現出快速採用勢頭,周活躍用戶周環比增長60%。目前超過32.5萬開發者在免費和付費層級積極使用Codex。但OpenAI及更廣泛AI行業面臨的根本問題是,像Codex-Spark承諾的速度改進是否能轉化為有意義的生產力提升,還是僅僅創造更愉快的體驗而不改變結果。

    Cerebras交易是一個經過計算的賭註:專用硬體可以解鎖通用GPU無法經濟高效服務的用例。對於一家同時與競爭對手作戰、管理緊張供應商關係並應對內部對其商業方向異議的公司而言,這也提醒人們,在AI競賽中,原地不動不是選項。OpenAI通過快速行動和打破常規建立了聲譽。現在它必須證明自己可以行動得更快——而不會破壞自己。

   

資訊來源:華爾街見聞。如有侵權,請聯繫我們刪除。



全新M.CBD國際商務中心火熱招商中yes歡迎來電預約參觀

參觀時間:週一~週五 9:00AM~19:00PM(新店) 9:00AM~18:00PM(內湖)

歡迎電洽:02-22199566(新店)  02-26585500(內湖)

新店地址:新店民權路108號10樓

內湖地址:內湖區陽光街321巷8號3樓

M.CBD商務中心專頁yes

FB粉絲專頁yes

民權路上租個人工作室2219-9566/北新路租商務中心/北新路上租個人工作室/大坪林捷運站租商務中心/
新店區租商務中心/新北市租商務中心2219-9566/新北市個人工作室/新北市在台辦事處/新店個人工作室/
新店在台辦事處/十四張捷運商務中心2219-9566/十四張捷運站租個人工作室/十四張捷運租在台辦事處/
租商務中心/租個人工作室/租在台辦事處2219-9566/稀有小坪數辦公室/出租商務中心/出租微型辦公室/
出租個人工作室/民權路出租商務中心/民權路上出租商務辦公室2219-9566/出租大坪林捷運站微型辦公室/
出租大坪林捷運站個人工作室/出租民權路小坪數辦公室/出租北新路小坪數辦公室/出租商務中心/
出租微型辦公室/出租個人工作室/出租M.CBD國際商務中心/


 
Copyright (C) 遠建不動產有限公司版權所有‧非經授權不得轉載、連結本站圖文 ©