Anthropic 最近經濟指數報告 202603 解讀—人工智慧對勞動市場的影響的初步證據

重点

Anthropic引入了一種衡量人工智慧替代風險的新指標——觀測暴露度，該指標結合了理論上的大語言模型能力與實際使用數據，並更側重於自動化（而非增強型）以及與工作相關的應用情境。
人工智慧遠未達到其理論能力：實際覆蓋率僅為理論可行範圍的一小部分。
美國勞工統計局預測，到2034年，觀測暴露度較高的職業，其就業成長將相對較慢。暴露度最高職業中的從業者，更可能是年齡較大、女性、教育程度較高且收入較高的族群。
Anthropic發現，自2022年底以來，高暴露度工人的失業率並未出現系統性上升，但有初步證據表明，在暴露度較高的職業中，年輕工人的招募速度有所放緩。

引言

人工智慧的快速普及正引發大量研究，試圖衡量和預測其對勞動市場的影響。然而，過往研究方法的記錄提醒我們應保持謙遜。不要慌張，不要燒包，不要踩踏，既不要盲信“2028人工智能替代導致經濟危機”，也要理性看待已經在海平面上湧現的這波AI技術浪潮。

Anthropic基於其公佈的經濟指數，不同於去年下半年著重討論不同地區和不同行業的AI採用率或自動化程度，在本文中，Anthropic開始討論在哪些行業，AI替代的程度並嘗試通過建立指標體系的方式對AI替代這一趨勢進行量化觀察和參考。

提出了一個理解人工智慧對勞動市場影響的新框架，並用早期數據對其進行了檢驗，發現迄今為止人工智慧影響就業的證據有限。目標是建立一種衡量人工智慧如何影響就業的方法，並定期重新進行這些分析。這種方法無法捕捉人工智慧重塑勞動市場的所有可能管道，但透過在顯著效應顯現之前奠定基礎，希望未來的發現能比事後分析更可靠地識別經濟衝擊。

人工智慧的影響很可能是清晰無誤的。當影響模糊不清時，這個框架將發揮最大作用——它或許能在替代發生之前，幫助識別出最脆弱的職位。

不要恐慌，從反事實分析開始思考──AI替代為什麼沒有實現？

當影響巨大而突然時，因果推論更為容易。新冠疫情及隨之而來的政策措施造成的經濟衝擊是如此顯著，以至於對於許多問題而言，複雜的統計方法都顯得多餘。例如，疫情爆發的最初幾週失業率急劇上升，幾乎沒有給其他解釋留下空間，可能也不需要太多解釋。
然而，人工智慧的影響可能不像新冠疫情，而更像網路。其影響可能無法立即從整體失業數據中顯現；貿易政策和商業週期等因素可能會模糊對趨勢線的解釋。

冷靜的找跡象－如何量化AI替代率？

本研究遵循基於任務的方法，結合了人工智慧理論能力和實際使用情況的衡量指標，然後匯總到職業層面。當某個任務在Anthropic的經濟指數樣本（Handa 等人，2025）中觀察到足夠的流量時，我們才認為它被覆蓋，並且會給予 API 使用（表明在生產系統中集成更深）更高的權重。定義公式如下：

WorkUsageᵢ 必須達到 100 次或佔總流量的 0.0025%³。觀察到的任務計數存在一個長尾，包含大量低計數用途，這可能反映了不常見的行為、測試或分類器錯誤。確切的 cutoff 值對工作排名影響很小。未達到 WorkUsageᵢ ≥ 100 門檻的任務，其覆蓋度為 0。

某些職業共享相同的任務，例如，「觀察和評估學生的表現、行為、社會發展和身體健康」這一任務出現在十類 K-12 教師中。類似地，有些任務可能只相差一個字或一個逗號。由於我們沒有記錄足夠的上下文資訊來將這些任務精確分配到某個特定職業，我們將這些完全相同或高度相似的任務進行分組，並根據各職業的就業份額，將任務計數平均分配給這些職業。

ClaudeWorkUsageᵢ 是在 Claude.ai 上被歸類為與工作相關的任務 t 的計數。 Anthropic依據 Appel 等人（2026）提出的用例原語，將範圍限制在與工作相關的對話記錄，而非教育或個人用例¹。將計數限制在與工作相關的用途上，似乎能更好地捕捉對勞動市場的潛在影響範圍。

例如，使用 AI 解釋科學講座（課業）或獲得治療傷害的建議（個人用途），與自動化教學或護理工作相去甚遠。最後一項，APIUsageᵢ，統計任務 t 的所有第一方 API 流量。我們不會對 API 呼叫是否與工作相關進行區分，因為 API 呼叫通常意味著已整合到生產工作流程中²。

————————————————
版权声明：本文为CSDN博主「oe1019」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/oe1019/article/details/158803512

Post Views: 443