NVIDIA GB200「Blackwell」NVL72 伺服器

Back
Category : News

擴展「混合專家」(MoE)AI 模型嘅效能,一直都係業界最大嘅限制之一,但 NVIDIA 好似成功突破咗,歸功於共同設計效能擴展定律。

AI 界一直喺度競賽擴大基礎大型語言模型(LLM),透過增加 token 參數嚟確保模型喺效能同應用上出色,但呢個方法有計算資源投資嘅上限。呢度「混合專家」前沿 AI 模型就派上用場,因為對一個查詢,佢哋唔會激活每 token 嘅全部參數,而係只激活一部分,取決於服務請求類型。雖然 MoE 喺 LLM 入面主導,但擴展佢哋會引入巨大計算瓶頸,NVIDIA 成功克服咗。

公司喺新聞稿入面透露,用 GB200「Blackwell」NVL72 配置,相比 Hopper HGX 200,效能基本上擴大咗 10 倍。公司測試咗佢嘅計算能力喺 Kimi K2 Thinking MoE 模型上,呢個開源 LLM 每前向傳遞有 320 億激活參數,喺佢嘅領域係佼佼者。綠隊聲稱 Blackwell 架構「準備好」利用前沿 MoE 模型嘅興起。

為咗解決擴展 MoE AI 模型涉及嘅效能瓶頸,NVIDIA 採用咗「共同設計」方法,即係利用 GB200 嘅 72 晶片配置,加上 30TB 快速共享記憶體,NVIDIA 將專家並行帶到全新水平,確保 token 批次不斷分割同散佈喺 GPU 上,通訊量以非線性速率增加。其他優化包括:其他全棧優化亦喺解鎖 MoE 模型高推理效能上發揮關鍵作用。NVIDIA Dynamo 框架協調分散式服務,分配預填充同解碼任務到唔同 GPU,讓解碼用大專家並行運行,而預填充用更適合佢工作負荷嘅並行技術。NVFP4 格式有助維持準確度,同時進一步提升效能同效率。

呢個成就對 NVIDIA 同佢嘅合作夥伴嚟講係重大發展,尤其 GB200 NVL72 配置而家喺供應鏈階段,好多前沿模型利用 AI 伺服器提升能力。MoE 模型以計算效率高聞名,所以佢哋喺廣泛環境部署越來越普遍,NVIDIA 好似喺呢個趨勢中心資本化。來源

艾倫·戴(Alan Dye)呢個帶領蘋果用戶介面團隊超過十年嘅設計高層,即將離開蘋果,加入Meta,負責領導Reality Labs入面一個新創意工作室,主要專注改善智能眼鏡同虛擬實境頭盔呢啲消費裝置嘅AI功能。佢會直接向Meta首席技術官Andrew Bosworth匯報。
喺蘋果度,Dye會由Steve Lemay接替,據蘋果CEO Tim Cook話,Lemay自1999年起,一直喺每個主要蘋果介面設計入面扮演關鍵角色。
Meta積極從競爭對手度挖人,包括今個夏天從OpenAI度挖咗研究員過嚟。有報導話Meta CEO Mark Zuckerberg親自送自家煲嘅湯去招攬OpenAI員工;OpenAI首席研究官Mark Chen話,佢之後都送湯去Meta度招人。
Zuckerberg喺新聞爆出之後,即刻宣布呢個新工作室,Dye會同另一個前蘋果設計師Billy Sorrentino(之前領導Reality Labs介面設計)、Joshua To(Reality Labs介面設計領袖)、Meta工業設計團隊(由Pete Bristol帶頭)同埋元宇宙設計同藝術團隊(由Jason Rubin領導)一齊工作。呢個工作室目標係將設計、時裝同科技融合,定義下一代產品同體驗,將智能視為一種新設計材料,充裕、有能力同以人為本,同時提升Meta入面嘅設計水平,透過工藝、創意視野、系統思維同埋建造標誌性硬件軟件產品嘅深厚經驗。閱讀原文

2025年,科技界有好大一股熱潮,好多獨角獸冒出頭,至少有80間初創公司估值超過10億美元。
呢個增長主要係因為AI嘅進步同投資,但其他領域都好勁,譬如衛星科技同區塊鏈交易。
今年入咗獨角獸行列嘅有Genspark,係AI代理公司,估值12.5億;Gamma,搞AI生成圖像,21億。
仲有Fireworks AI,AI基建平台,40億;Reflection,開發開放基礎模型,80億。
呢個名單顯示咗科技應用好多元化,同埋有大筆投資支持呢啲快速成長嘅公司。閱讀原文

DeepSeek 呢間中國 AI 公司,啱啱公布咗最新嘅 V3.2 AI 模型,據講性能可以同 OpenAI 嘅 GPT-5 同 Google 嘅 Gemini 3.0 Pro 匹敵。
呢啲模型係完全開源同免費嘅,引入咗創新嘅稀疏注意力技術,將成本降低 50% 添。
呢個發布喺 AI 界引起咗好大迴響,因為畀咗大眾一個高性能嘅選擇,而唔使依賴大公司嘅專有模型。閱讀更多

Nvidia 投資咗20億美金落 Synopsys 度,嚟加強晶片設計軟件嘅發展。
呢個投資係佢哋擴大多年合作嘅一部份,會一齊開發新工具,用嚟加速 AI 計算同設計流程。
Synopsys 嘅軟件係用嚟設計晶片嘅,而 Nvidia 想透過呢個合作,提升佢哋嘅 GPU 加速計算能力。
呢個消息令到 Synopsys 股價升咗,投資者好樂觀。閱讀更多

AI 初創公司 Runway 喺星期一宣佈咗 Gen 4.5,呢個新影片模型喺獨立基準測試入面,打敗咗 Google 同 OpenAI 嘅類似模型。
呢間公司嘅客戶包括媒體機構、工作室、品牌、設計師、創意人士同學生。根據 PitchBook,佢嘅估值已經脹到 35.5 億美元。Runway 嘅投資者包括 General Atlantic、Baillie Gifford、Nvidia 同 Salesforce Ventures 等。
Runway 話 Gen 4.5 好叻理解物理、人類動作、鏡頭移動同因果關係。閱讀更多

Autodesk Fusion 360 AI 喺 2025-11-10 教育版上線,文字生成 3D 建築模型同結構分析。

歐美建築學院採用。創新設計加速。

學生 project 靚仔。

Architecture AI 來源 Autodesk

呢個最近推出嘅Token-Oriented Object Notation (TOON),就係一個schema-aware嘅JSON替代品,目標係大幅減少令牌消耗,但準確度維持相似。
令牌節省嘅實際效果同數據形狀有關,部份基準測試顯示,TOON喺某些情況下比JSON少用40%令牌,咁樣就可能節省LLM同推理成本。
例如,喺一個線上遊樂場跑呢個例子,會見到比起pretty-printed JSON減少55%令牌,比compact JSON減少25%,同YAML比減少38%。
TOON結合咗YAML(用嚟嵌套物件)同CSV(用嚟均勻陣列)嘅佈局嚟慳令牌。
不過,對於非均勻數據,JSON可能更有效率;對於深度嵌套物件,YAML可能更慳令牌;平坦數據集,CSV仍然係最緊湊嘅格式。

LocalSend 係一款免費、開源嘅跨平台文件傳輸工具,支持Windows、macOS、Linux、Android 同 iOS 等主流操作系統。
佢透過 HTTPS 實現端到端加密傳輸,唔使互聯網或者外部伺服器,即可在局域網內高速、安全咁傳輸文件同文本。
佢嘅核心優勢在於打破平台壁壘,提供高效安全嘅本地文件共享方案,讓你多設備互聯互通變得前所未有嘅簡單。

主要特點:
• 跨平台互通性:無論係 Windows、macOS、Linux 電腦,定係 Android、iOS 手機同平板,LocalSend 都能輕鬆應對。
告別傳統文件傳輸工具喺唔同品牌設備間嘅限制,所有設備都能無縫連接,實現文件自由流轉。
• 极速傳輸體驗:只要設備處於同一局域網內,LocalSend 嘅傳輸速度甚至可以媲美蘋果嘅 AirDrop。
• 簡單便捷嘅操作:只需喺需要傳輸文件嘅設備上分別安裝客戶端,並確保佢哋連接同一 Wi-Fi 網絡(即使係插網線嘅電腦都能同連接 Wi-Fi 嘅手機相連)。
打開軟件後,設備會自動發現,只需簡單拖拽或者點擊即可選擇文件、文件夾或者文本進行傳輸。
• 安全同隱私保障:採用 HTTPS 進行端到端加密傳輸,確保數據喺傳輸過程中唔被竊取或者篡改。
所有傳輸都喺本地局域網內完成,唔使上傳至雲端伺服器,有效保護個人隱私。
• 靈活多樣嘅傳輸內容:除了文件同文件夾,LocalSend 仲支持文本傳輸,呢個對於需要快速分享代碼片段、筆記或者鏈接嘅用戶嚟講非常實用。
此外,佢甚至可以作為簡易嘅手機 APK 提取器,方便備份同分享限制性應用。

LocalSend 唔止喺傳統局域網傳輸方面表現出色,更有令人驚喜嘅「隱藏技能」—支持虛擬局域網!
呢個意味住,即使你嘅設備唔喺同一個物理局域網內,只要透過 Tailscale 等工具組建虛擬局域網,LocalSend 依然能夠實現文件傳輸。
呢個無疑為遠程協作、多地辦公等場景提供咗全新嘅解決方案,讓文件傳輸嘅邊界無限延伸。

閱讀更多

喺2025世界機械人大會(WRC 2025)度,新加坡南洋理工博士張其峰公布咗全球首個孕育機械人研究,呢個機械人專門用嚟模擬孕育過程,據講一年內就會面世。
研究團隊話,呢個機械人可以幫到高齡孕婦或者有生育困難嘅人,透過先進AI同機械技術,模擬子宮環境,提供安全嘅孕育方案。
市場分析指,全球生育率下降,呢類產品潛力巨大,預計中國市場單獨就達百億級別,投資者已經開始關注呢個新興領域。
專家仲話,雖然技術仲有挑戰,但成功推出將會改變醫療產業格局。”