Harmonic,一間由羅賓漢(Robinhood)首席執行官Vlad Tenev共同創辦嘅人工智能初創公司,喺2025年7月28號正式推出咗佢哋嘅AI聊天機器人應用程式,呢個程式目前喺iOS同Android平台上以測試版形式提供。呢個名為Aristotle嘅AI模型,專注於數學推理,佢嘅目標係提供完全無幻覺(hallucination-free)嘅答案,特別係喺需要精準計算嘅領域,例如數學、物理同電腦科學。Harmonic嘅首席執行官Tudor Achim喺同TechCrunch嘅訪問中提到,Aristotle係第一個公開提供推理功能同正式驗證輸出嘅產品,喺量化推理領域入面,佢哋保證完全唔會有幻覺問題。
同其他大型語言模型(LLM)唔同,Harmonic嘅Aristotle唔係以自然語言處理為主,而係專注於正式數學推理。佢用咗開源程式語言Lean去生成答案,並且喺回應之前,會透過一個唔依賴AI嘅算法流程去雙重檢查答案嘅準確性。呢種方法同醫療設備同航空等高風險領域用來驗證輸出嘅技術類似,確保咗Aristotle喺數學問題上嘅高精確度。Tenev同Achim都強調,呢種以數學為核心嘅方法,係未來AI發展嘅一個重要方向,因為佢可以完全消除幻覺問題,提供可驗證同可審計嘅結果。
Aristotle喺2025年國際數學奧林匹克(IMO)嘅正式測試中,獲得咗金牌表現,呢個測試將數學問題轉化成機器可讀格式,顯示出佢喺高難度數學問題上嘅出色能力。雖然Google同OpenAI嘅AI模型同樣喺今屆IMO獲得金牌,但佢哋用嘅係非正式嘅自然語言測試,相比之下,Harmonic嘅方法更加嚴謹。Harmonic暫時未有公開Aristotle喺其他基準測試嘅表現,但佢哋聲稱,呢個模型喺MiniF2F基準測試中,喺短短一個月內就將成績從83%提升到90%,顯示出快速嘅進步。
Harmonic嘅願景唔止於數學,佢哋計劃將Aristotle嘅能力擴展到其他需要精確推理嘅領域,例如物理同電腦科學。未來,佢哋仲計劃推出一個API,畀企業可以接入Aristotle嘅功能,同時會開發一個面向消費者嘅網頁應用程式。呢間公司喺2023年由Tenev同Achim創辦,喺2025年7月完成咗一輪1億美元嘅B輪融資,由Kleiner Perkins領投,Sequoia Capital、Index Ventures同Paradigm等投資者參與,估值達到8.75億美元。Tenev喺訪問中提到,佢哋刻意將估值控制喺10億美元以下,認為唔應該追求最高嘅估值,而係專注於長期發展。
喺AI行業入面,幻覺問題一直係一個挑戰,即使係最先進嘅模型,例如OpenAI嘅最新推理模型,幻覺問題都仲未完全解決。Harmonic嘅方法,通過數學嘅嚴謹性同正式驗證,提供咗一個新嘅方向。Aristotle嘅推出唔單止係Harmonic嘅一個里程碑,仲為AI喺高精確度應用嘅未來鋪路,例如喺區塊鏈、金融服務同航天等需要零錯誤嘅行業。呢個聊天機器人應用程式嘅beta版,畀用戶一個機會去體驗呢種新嘅AI技術,同時為Harmonic未來的擴展同商業化打下基礎。想了解更多詳情,可以瀏覽TechCrunch。