Meta 發布開源 Llama 4 模型

Back
Category : News

Meta 出咗 Llama 4,開源畀大家用,參數多達 500B,效能追得上 GPT-4!開發者可以 fine-tune 做自己 app,coding 任務準確率 95%。AI 社群好興奮,話呢個加速創新。Tech-ed 平台已經整合,學生免費學 machine learning。來源

不過,有安全隱憂,Meta 提供指南防濫用。全球下載量破紀錄,未來 AI 民主化。

Google 啱啱推咗 Duet AI 2.0,專門幫 coder 寫 code,準到嚇人!佢可以根據你描述,自動生成完整 function,甚至 debug 錯誤。支援 Python、JavaScript 同 Java,速度快咗兩倍。Tech-ed 界話,呢個工具會改變 coding 教學方式,新手學得更快。Google 仲免費畀學生用,推廣 AI 教育。測試中,佢解決咗 90% bug,好多公司已經 adopt。來源

不過,有人批評依賴 AI 會令 coder 技能退化,但 Google 話係輔助工具。未來,coding 課程會融入呢啲 AI,學生專注邏輯而非 syntax。

中介軟件(Middleware)喺2025年嘅數位轉型浪潮中,變得越來越重要。作為連繫唔同應用程式同系統嘅橋樑,中介軟件幫企業實現咗無縫數據流同系統整合。尤其係喺混合雲環境同多雲策略嘅普及下,企業對中介軟件嘅需求急劇上升。根據最新報告,全球中介軟件市場預計喺2026年將達到450億美元,年增長率高達12%。

以Red Hat OpenShift同Apache Kafka為例,呢啲中介軟件平台提供咗強大嘅消息傳遞同數據流處理能力,幫企業喺唔同嘅雲端同本地系統之間實現高效協作。例如,一間全球物流公司利用Kafka,將實時貨運數據同客戶端應用程式連繫起來,成功將物流追蹤嘅延遲降低咗60%。呢類技術唔單止提升咗運營效率,仲幫企業喺客戶服務上搶得先機。

中介軟件嘅另一大趨勢係同AI同機器學習嘅結合。透過AI驅動嘅中介層,企業可以喺唔同系統之間實現智能數據路由同自動化決策。例如,喺製造業,某間工廠利用AI中介軟件,實時監控生產線數據,自動調整資源分配,將生產效率提升咗25%。呢啲技術嘅應用,令到中介軟件唔再只係「連接器」,而係企業數位轉型嘅核心引擎。

當然,挑戰依然存在。中介軟件嘅部署同維護需要專業知識,企業喺引入新技術時,經常會遇到技術人才短缺嘅問題。此外,唔同中介軟件之間嘅相容性同標準化問題,亦都係企業需要解決嘅難題。專家建議,企業喺選擇中介軟件時,應該優先考慮開源解決方案,因為佢地嘅靈活性同社群支援通常更強。總括嚟講,中介軟件市場嘅快速發展,預示住企業數位化嘅未來將更加智能同高效。

來源:https://caistack.com/blog/the-role-of-ai-middleware-in-enterprise-digital-transformation/

Google嘅量子電腦團隊喺11月公佈咗重大突破,用量子位元解決咗傳統編程嘅瓶頸問題。呢個Sycamore升級版,可以喺幾分鐘內完成傳統超算要幾年嘅任務,特別適合AI訓練同複雜演算法優化。研究員話,佢已經成功模擬咗大型神經網絡,效能比古典電腦快100萬倍。教育界興奮壞咗,因為Tech-ed課程可以即刻引入量子編程工具。開源社區仲釋出咗SDK畀開發者試用。當然,有專家擔心安全,但Google強調加密技術已升級。嚟睇詳細報導啦

呢樣野會改變晒coding世界,學生學得更快更深。

Google嘅量子電腦團隊喺11月公佈咗重大突破,用量子位元解決咗傳統編程嘅瓶頸問題。呢個Sycamore升級版,可以喺幾分鐘內完成傳統超算要幾年嘅任務,特別適合AI訓練同複雜演算法優化。研究員話,佢已經成功模擬咗大型神經網絡,效能比古典電腦快100萬倍。教育界興奮壞咗,因為Tech-ed課程可以即刻引入量子編程工具。開源社區仲釋出咗SDK畀開發者試用。當然,有專家擔心安全,但Google強調加密技術已升級。嚟睇詳細報導啦

呢樣野會改變晒coding世界,學生學得更快更深。

DeepMind AlphaFold 3碼開源。來源

生物資訊教育。

擴展「混合專家」(MoE)AI 模型嘅效能,一直都係業界最大嘅限制之一,但 NVIDIA 好似成功突破咗,歸功於共同設計效能擴展定律。

AI 界一直喺度競賽擴大基礎大型語言模型(LLM),透過增加 token 參數嚟確保模型喺效能同應用上出色,但呢個方法有計算資源投資嘅上限。呢度「混合專家」前沿 AI 模型就派上用場,因為對一個查詢,佢哋唔會激活每 token 嘅全部參數,而係只激活一部分,取決於服務請求類型。雖然 MoE 喺 LLM 入面主導,但擴展佢哋會引入巨大計算瓶頸,NVIDIA 成功克服咗。

公司喺新聞稿入面透露,用 GB200「Blackwell」NVL72 配置,相比 Hopper HGX 200,效能基本上擴大咗 10 倍。公司測試咗佢嘅計算能力喺 Kimi K2 Thinking MoE 模型上,呢個開源 LLM 每前向傳遞有 320 億激活參數,喺佢嘅領域係佼佼者。綠隊聲稱 Blackwell 架構「準備好」利用前沿 MoE 模型嘅興起。

為咗解決擴展 MoE AI 模型涉及嘅效能瓶頸,NVIDIA 採用咗「共同設計」方法,即係利用 GB200 嘅 72 晶片配置,加上 30TB 快速共享記憶體,NVIDIA 將專家並行帶到全新水平,確保 token 批次不斷分割同散佈喺 GPU 上,通訊量以非線性速率增加。其他優化包括:其他全棧優化亦喺解鎖 MoE 模型高推理效能上發揮關鍵作用。NVIDIA Dynamo 框架協調分散式服務,分配預填充同解碼任務到唔同 GPU,讓解碼用大專家並行運行,而預填充用更適合佢工作負荷嘅並行技術。NVFP4 格式有助維持準確度,同時進一步提升效能同效率。

呢個成就對 NVIDIA 同佢嘅合作夥伴嚟講係重大發展,尤其 GB200 NVL72 配置而家喺供應鏈階段,好多前沿模型利用 AI 伺服器提升能力。MoE 模型以計算效率高聞名,所以佢哋喺廣泛環境部署越來越普遍,NVIDIA 好似喺呢個趨勢中心資本化。來源

艾倫·戴(Alan Dye)呢個帶領蘋果用戶介面團隊超過十年嘅設計高層,即將離開蘋果,加入Meta,負責領導Reality Labs入面一個新創意工作室,主要專注改善智能眼鏡同虛擬實境頭盔呢啲消費裝置嘅AI功能。佢會直接向Meta首席技術官Andrew Bosworth匯報。
喺蘋果度,Dye會由Steve Lemay接替,據蘋果CEO Tim Cook話,Lemay自1999年起,一直喺每個主要蘋果介面設計入面扮演關鍵角色。
Meta積極從競爭對手度挖人,包括今個夏天從OpenAI度挖咗研究員過嚟。有報導話Meta CEO Mark Zuckerberg親自送自家煲嘅湯去招攬OpenAI員工;OpenAI首席研究官Mark Chen話,佢之後都送湯去Meta度招人。
Zuckerberg喺新聞爆出之後,即刻宣布呢個新工作室,Dye會同另一個前蘋果設計師Billy Sorrentino(之前領導Reality Labs介面設計)、Joshua To(Reality Labs介面設計領袖)、Meta工業設計團隊(由Pete Bristol帶頭)同埋元宇宙設計同藝術團隊(由Jason Rubin領導)一齊工作。呢個工作室目標係將設計、時裝同科技融合,定義下一代產品同體驗,將智能視為一種新設計材料,充裕、有能力同以人為本,同時提升Meta入面嘅設計水平,透過工藝、創意視野、系統思維同埋建造標誌性硬件軟件產品嘅深厚經驗。閱讀原文

2025年,科技界有好大一股熱潮,好多獨角獸冒出頭,至少有80間初創公司估值超過10億美元。
呢個增長主要係因為AI嘅進步同投資,但其他領域都好勁,譬如衛星科技同區塊鏈交易。
今年入咗獨角獸行列嘅有Genspark,係AI代理公司,估值12.5億;Gamma,搞AI生成圖像,21億。
仲有Fireworks AI,AI基建平台,40億;Reflection,開發開放基礎模型,80億。
呢個名單顯示咗科技應用好多元化,同埋有大筆投資支持呢啲快速成長嘅公司。閱讀原文

DeepSeek 呢間中國 AI 公司,啱啱公布咗最新嘅 V3.2 AI 模型,據講性能可以同 OpenAI 嘅 GPT-5 同 Google 嘅 Gemini 3.0 Pro 匹敵。
呢啲模型係完全開源同免費嘅,引入咗創新嘅稀疏注意力技術,將成本降低 50% 添。
呢個發布喺 AI 界引起咗好大迴響,因為畀咗大眾一個高性能嘅選擇,而唔使依賴大公司嘅專有模型。閱讀更多