Google DeepMind 開源 Aeneas,

Back
Category : News

Google DeepMind 開源咗 Aeneas,呢個係一個生成式 AI 模型,用嚟理解古代銘文。Aeneas 可以處理文字同埋圖像輸入,而且喺修復損壞銘文入面缺失嘅字符方面,表現比其他最先進嘅模型更好。

Aeneas 係為咗幫助歷史學家嚟做 epigraphy,即係研究古代銘文。佢幫手自動化幾個關鍵任務:估計銘文嘅日期;識別銘文起源嘅地區;重建部分銘文;同埋識別相似嘅銘文,即係有類似字詞或表達嘅銘文。Aeneas 用 multimodal transformer 架構做骨幹,每個任務都有專門嘅頭部。喺幾個 epigraphic 任務評估入面,Aeneas 勝過咗最先進嘅 AI 模型同埋人類歷史學家。當人類歷史學家用 Aeneas 做工具嚟做同樣任務嘅時候,合併嘅表現仲更好。根據 DeepMind 講,

“我哋嘅模型都可以適應其他古代語言、文字同媒體,由 papyri 到 coinage,擴大佢嘅能力嚟幫助喺更廣泛嘅歷史證據入面畫連接…呢個工作係更廣泛努力嘅一部分,探索生成式 AI 點樣幫歷史學家更好咁識別同解釋大規模嘅相似之處。我哋想呢個研究惠及盡可能多嘅人,所以我哋將 Aeneas 嘅互動版本免費提供畀研究員、學生、教育工作者、博物館專業人士等等….”

Aeneas 建基喺 DeepMind 嘅 Ithaca 項目之上,Ithaca 係一個只處理文字嘅模型,用嚟喺古希臘文本做 epigraphy。Aeneas 加咗圖像輸入支援。Aeneas 仲可以修復未知缺失字符數目嘅銘文,同埋輸出相似之處,呢啲係 Ithaca 冇嘅能力。

為咗訓練模型,DeepMind 組合咗 Latin Epigraphic Dataset (LED),一個包含 176,861 個銘文嘅語料庫。佢哋由現有來源數據集開始,然後創建一個「複雜管道」嚟清潔記錄同埋將佢哋合併成單一格式。數據包含由公元前 7 世紀到公元 8 世紀嘅銘文,由英國到美索不達米亞嘅羅馬世界地區。

為咗評估佢作為研究工具嘅有效性,DeepMind 進行咗一個研究,有 23 個 epigraphic 專家用 Aeneas 喺「模擬真實世界研究工作流程」入面,有時間限制。人類專家手動選擇相似銘文,但通常都會加入至少一個 Aeneas 建議嘅額外一個。一個研究員聲稱:

“Aeneas 檢索嘅相似之處完全改變咗我嘅歷史焦點…要搵呢啲文本,我要花幾日而不是 15 分鐘。如果我要基於呢啲銘文嘅閱讀嚟做歷史解釋,現在我有幾日嚟寫同框架研究問題,而不是搵相似之處。”

喺 Hacker News 關於 Aeneas 嘅討論入面,一個用戶寫:

“[對]我嚟講,呢啲只係有根據嘅猜測,因此每次用工具都要有呢個免責聲明。話雖如此 – 好多 (古代) 歷史係基於部分資訊嘅有根據猜測。即使我哋有好多寫作可用,好似 Cicero,我哋都要承認我哋係從特定觀點睇事件,有人有自己嘅偏見同動機。所以我哋試圖基於有某種 ‘數據質量問題’ 嘅數據嚟推斷歷史發生咗乜。”

Aeneas 嘅代碼喺 GitHub 上可用。仲有 Aeneas 互動演示網站。