![]()
華為昇騰計算領域副總裁劉偉近日在“2025華為算力場景發布會暨北京xPN夥伴大會”上,分享咗昇騰APN喺一啲場景上嘅最新進展。據劉偉透露,APN芯片嘅出貨量同之前比有顯著增長,2025年上半年出貨量同比增長1.2倍,顯示出華為喺AI算力領域嘅強勁勢頭。同時,華為昇騰已經完善咗對夥伴體系嘅管理,支援鑽石級夥伴通過自家渠道直接向華為下單,進一步提升咗合作效率同靈活性。
劉偉提到,喺人工智能爆發階段,客戶需求係重中之重。佢同團隊會更多同最終客戶接觸,深入了解佢哋嘅實際需求,再結合夥伴嘅技術能力,將合適嘅項目推薦畀相關夥伴。呢個策略有助於精準匹配客戶同解決方案,推動AI技術喺實際應用場景嘅落地。喺2025年下半年,華為昇騰計劃採取由低算力到高算力全面覆蓋邊端場景嘅策略,重點投入Atlas 300I A2同310模組嘅研發同市場推廣,以提升產品解決方案嘅競爭力同生態豐富度。
Atlas 300I A2同310模組係華為昇騰喺AI推理場景嘅重要產品。當中,Atlas 300I A2推理卡以其高效能同低功耗聞名,單卡可提供高達140 TOPS INT8算力,適合用於OCR識別、語音分析、搜尋推薦同內容審核等多種AI應用場景。而310模組系列則喺今年針對特定巨深場景同低功耗場景,發佈咗70T同100T算力嘅310P模組,進一步擴展咗應用範圍。劉偉仲提到,910B嘅300A2標卡目前處於早期出貨階段,主要用於數據中心,團隊正同夥伴喺一啲場景中驗證方案可行性,預計之後會實現批量出貨。
劉偉強調,喺人工智能發展過程中,客戶嘅具體需求未必同算力直接掛鈎。佢指出,有時即使算力達到很高水平,都未必完全滿足客戶嘅實際訴求。因此,喺拓展客戶場景時,華為昇騰以滿足客戶實際需求為最終目標,而唔係單純追求算力同功耗嘅競爭。目前,華為昇騰產品嘅應用場景已從早前嘅應急、教育、醫療、金融等領域,快速滲透到傳統行業,產品系列算力範圍由8T到560T,主要支援INT8類型。劉偉仲提到,人工智能嘅發展唔應該單靠算力嘅線性增長,而需要用非線性嘅方式,跳出單純算力思維,通過其他創新方法解決問題。
喺性能方面,劉偉透露,300I A2喺運行32B模型時,兩卡性能係友商嘅兩倍,四卡運行70B模型時性能則係友商嘅1.5倍。同時,華為昇騰嘅CANN異構計算架構已全面開源,擁有靈活嘅架構同完備嘅工具鏈,計劃喺2025年底完成A2版本嘅開源工作。喺開源方面,雖然編譯器同指令集層面唔係所有夥伴都能輕鬆應對,但其他部分會逐步開源,並積極對接Triton、ARM等開源社區,目前已完成部分對接工作。呢啲舉措有助於進一步豐富昇騰生態系統,提升其喺全球AI算力市場嘅競爭力。
華為昇騰喺AI算力領域嘅快速發展,反映咗其喺技術創新同市場拓展方面嘅持續努力。隨住Atlas 300I A2同310模組嘅重點投入,華為有望喺下半年進一步鞏固其喺AI推理同邊端場景嘅領先地位,為行業提供更高效、更靈活嘅算力解決方案。更多詳情請見:https://www.infoq.cn/news/MdoOgoMF0XxpGhtm6zHL