Google 推出 LLM-Evalkit

Back

Category : News

Google 最近推出咗 LLM-Evalkit，係一個輕量級嘅開源應用程式，用 Vertex AI SDKs 喺 Google Cloud 上建構。

佢主要解決團隊喺處理大型語言模型 (LLM) 時，提示散落喺文件、試算表同雲端控制台等地方，導致迭代唔夠效率、手動操作同結果唔一致嘅問題。

呢個框架可以讓團隊追蹤客觀指標，並更有效咁迭代。

主要功能包括集中工作流程、度量驅動評估、無代碼介面，同埋開源合作。

用戶可以定義特定問題、收集相關數據集，並建立客觀指標嚟評估 LLM 輸出，從而系統化咁基準測試同量度改進。

呢個工具適合非開發人員使用，減少瓶頸並促進技術同非技術團隊成員之間嘅合作。

想開始用，可以去 GitHub 倉庫 https://github.com/GoogleCloudPlatform/generative-ai/tree/main/tools/llmevalkit 查看。

Post Views: 1,285