Azure AI Language 推出新版訓練配置與多語言支援

Back
Category : News

thumbnail

Microsoft Azure AI Language 服務最近迎來咗一波重大更新,專注於提升語言處理能力同多語言支援,畀開發者同企業有更多工具去應對複雜嘅文本分析需求。當中最引人注目嘅係新版 訓練配置 2024-08-01-preview,專為改善意圖識別嘅質量而設,特別係喺處理非領域內語句(out-of-domain utterances)時表現更加出色。同時,對話個人身份信息(PII)隱藏服務 喺英語環境下已經正式全面推出(Generally Available, GA),而 對話摘要 功能就新增咗 12 種語言嘅預覽支援,進一步擴展咗應用範圍。

講到呢個新版訓練配置,CLU(Conversational Language Understanding) 2024-08-01-preview 版本通過優化算法同訓練數據,顯著提升咗意圖識別嘅準確性。呢個更新對於開發聊天機械人、虛擬助手同客戶服務應用嘅開發者嚟講尤其重要,因為佢可以更精準咁理解用戶嘅意圖,哪怕係喺唔熟悉嘅語境下。舉個例,如果一個用戶問一個同訓練數據唔完全相關嘅問題,呢個新版模型都能夠更好咁識別同回應,減少誤解同提升用戶體驗。

另外,對話個人身份信息(PII)隱藏服務 喺英語環境下正式 GA,意味著企業可以放心喺生產環境中使用呢個功能,去保護用戶嘅敏感信息,例如姓名、電話號碼同地址等。喺最新嘅 API 版本 2024-11-15-preview 入面,Microsoft 仲新增咗一個選項,畀用戶可以選擇用標籤(例如 PERSON_1、PHONENUMBER_1)嚟代替傳統嘅遮蓋字符(例如 ****),令到隱藏後嘅文本更加易於閱讀同分析。呢個功能對於需要喺對話中提取敏感信息但又要保護私隱嘅場景,例如醫療同金融行業,特別有用。

喺多語言支援方面,對話摘要 功能現已支援 12 種額外語言(目前處於預覽階段),包括一啲常用嘅歐洲同亞洲語言。呢個更新令到 Azure AI Language 可以更好咁服務全球用戶,特別係喺多語言客服中心同國際化應用場景中。Microsoft 仲提到咗,佢哋喺 2023-11-15-preview API 版本入面擴展咗語言檢測嘅支援,新增咗根據 ISO 15924 標準嘅額外腳本,特別適合一啲使用變音符號(diacritics)嘅語言,例如日耳曼語同斯拉夫語。呢啲語言嘅數據增強功能(data augmentation)可以生成更多訓練數據變體,進一步提升模型嘅表現。

除此之外,Azure AI Language 仲將一啲功能遷移到 Azure AI Foundry 平台,包括 提取醫療信息提取對話同文本 PII文本摘要對話摘要 等。呢啲功能喺 AI Foundry 嘅遊樂場(playground)入面可以直接試用,畀開發者更容易測試同部署。Microsoft 亦都提到,佢哋根據客戶反饋,喺 2025 年 1 月 10 日退役咗一啲舊有嘅預覽功能,例如 自訂情感分析自訂醫療文本分析,轉而專注於利用生成式 AI 嘅新功能,滿足客戶嘅新需求。

總體嚟講,Azure AI Language 嘅呢啲更新展現咗 Microsoft 喺自然語言處理領域嘅持續努力,特別係喺多語言支援同敏感數據保護方面嘅進步。開發者可以利用呢啲新功能,打造更智能、更安全嘅應用,進一步推動數碼轉型。想了解更多,可以瀏覽 Microsoft Learn