近年來,人工智能正悄然豐富著古典學的研究方式,為古典文本的??薄⒎g與注釋,古典文學的解讀,碑銘和紙草等古代文物研究帶來革命性突破。人工智能的快速發展,解決了傳統研究方法在工作效率上的問題。不過,這一新興技術的應用與“慢工出細活”的傳統認識有所背離,還可能削減研究者享受的趣味。當熱愛古典學的計算機愛好者在利物浦古典學群郵中宣稱,希望有學者愿意一同用人工的翻譯來訓練人工智能翻譯古典文本時,有學者表示強烈反對,指責人工智能翻譯的作品質量低劣,甚至損害了古典文本的美感;也有學者聲稱這威脅到古典學家的飯碗;還有人認為即使訓練人工智能,人的翻譯也是不可替代的創造性工作。當學生開始利用人工智能完成作業,這是否意味著傳統的古典學教學模式面臨一些挑戰?以模式化的方式處理材料是否會令學者成為技術員工?人工智能到底會對古典學這門古老的學科產生怎樣的影響?本文試圖介紹人工智能在古代傳世文獻與出土文物方面的應用,揭示人機協作在古典學研究的前景。
古典文本分析與數字化
古典學巨擘維拉莫維茨曾在1872年用“未來語文學”嘲諷尼采的《悲劇的誕生》,如今普林斯頓大學芭芭拉·格雷西斯團隊將其挪用于表達人工智能在語文學的前景,即機器學習在處理抄本、印刷版和電子版的文本時能為語文學提供新的方法和視角。該團隊探討了人工智能如何輔助古希臘文本的???,并指出這種跨學科合作的潛在益處和挑戰。通過設計算法,人工智能可以自動檢測并糾正抄工的錯誤,并提出文本殘缺處可能的??边x擇。然而,在涉及文本的真實性和可靠性時,這種方法也面臨挑戰。對于填補缺失文本,人工智能可以通過模擬缺失部分來評估算法的準確性。但對于糾正抄寫方面的錯誤,評估難度則更大。普林斯頓團隊提出了一種基于概率的算法,通過權衡文本的可能性和機器的置信度來檢測和糾正錯誤。
人工智能不僅能輔助古典文本的???,還可以用于研究作者問題并進行文學闡釋。由于人工智能進行詞頻統計、語義分析和文本結構解析的速度更快,更全面和高效的文本分析為荷馬史詩的作者問題提供了一份參考答案——《伊利亞特》和《奧德賽》由多位作者共同創作。悲劇《雷索斯》曾經被學者歸為歐里庇得斯之作,而人工智能通過量化分析多部劇作揭示出該劇的文風受到埃斯庫羅斯和歐里庇得斯的顯著影響,但作者可能是一位公元前4世紀的演員。文學闡釋方面,人工智能可以識別文學隱喻與修辭模式、分析古典文獻的情感表達,從而為古代情感研究奠定技術基礎。不過,人工智能在還原文本語境和文意闡釋方面還存在不少問題?;诖耍藱C協作可以兼顧重構文本的準確性和美感。
此外,人工智能還有助于將古典文獻數字化并改變文獻檢索的方式。古典文獻的特殊字體和抄本的年代久遠,傳統光學字符識別技術的準確率有限。近年來,谷歌開發的新光學字符識別和神經網絡算法有助于識別復雜字體,從而助力古典文獻的數字化。在古典文獻檢索方面,日本學界正致力于建設專業的西方古典學人工智能對話機器“古代文本”。目前其文本庫存有限,對于較為冷門的古典作家則仍需采用傳統的檢索方式,暫時無法取代專業數據庫資源。
出土文物的識讀、重構與鑒別
公元79年因維蘇威火山爆發而被掩埋、因高溫碳化而變得異常脆弱的紙草文獻是研究古希臘羅馬歷史的重要資料。學者曾利用X射線斷層掃描技術對其進行3D掃描,在3D圖像中精準追蹤并鋪平卷曲的紙草層。盡管技術不斷進步,赫庫蘭尼姆紙草文獻的修復依然面臨諸多挑戰,其中最顯著的便是紙草碎片的數量龐大、結構復雜。由于其卷曲碳化后,層與層之間高度粘連,造成重疊層以及編號混亂。早期的剝離操作可能已經破壞紙草原有的物理結構,而19世紀的不少摹本存在偽造之嫌疑,利用碳化紙草及其摹本研究仍然困難重重。
為此,布里斯托大學的托馬斯·考沃德利用開源三維網格處理軟件對三維卷軸模型進行精密分析,可在虛擬環境中模擬紙草的曲面結構,以地球儀般自由旋轉觀察紙草纖維的痕跡與層次變化。相比常見的電子顯微鏡和人工肉眼觀察,該工具不僅可以放大對比碳化層的顏色變化,也可測量縫隙、推測卷繞方向,由此推測筆畫走向從而重建文本。借助攝影測量與3D打印等技術,一些卷軸模型已經以實體形式復現,為研究者提供了獨特的觀察體驗,也為??奔埐輲砹诵逻M展。例如,在赫庫蘭尼姆紙草第243篇第2段中,19世紀抄寫者曾將其中一行殘缺文本補足為著名的希臘化作者“卡利馬科斯”,而考沃德提出新的解釋,認為應是涉及赫爾墨斯與阿卡卡利斯的故事,并將首行殘留字母改讀為“卡利多斯”,即殘缺的“阿卡卡利斯”的屬格形式。與此同時,卷軸排版的研究也得到新的解釋,作品標題與卷次有時候會并排排列,這種排版方式可能與該紙草在卷軸中的具體位置和功能有關。考沃德致力于在未來推廣這項新技術,以方便紙草學家遠程獲取資料,也為未來實現自動化識別與虛擬修復紙草奠定堅實基礎。
蒙森等學者主張“親眼看”碑銘實物的原則也曾被紙草學家吸收,這一原則在當今數字化時代可能不再是金科玉律,對碳化紙草尤其如此。過去學者們千里迢迢趕往梵蒂岡圖書館、巴黎國家圖書館等現場去親眼看紙草或抄本實物,如今紙草重疊結構、殘碎的纖維、墨跡等肉眼無法看清的細節,在3D成像上實際更加清晰。除碳化紙草之外,對于保存情況相對較好的紙草,佛羅倫薩團隊通過人工神經網絡來重新排列紙草殘篇,轉錄項目正嘗試訓練人工智能基于字母寬度和筆畫匹配度提取紙草上的字母實現“機器看”,由機器直接識別字母。
對于碑銘和錢幣而言,“親眼看”和“機器看”的結合也同樣有益。生成式人工智能在碑銘翻譯方面為研究帶來便捷,提升了初學者瀏覽和整理史料的速度,而伊薩卡項目不僅能夠復原殘缺的銘文,還能為碑銘的銘刻時間與地理位置提供參考。不過需要注意的是,目前銘文數據庫的開源程度較低,可參考的平行文本數量較少且年代久遠。在錢幣鑒定方面,人工智能利用計算機視覺技術分析錢幣圖像,識別其正反面肖像、鑄幣廠標記等符號,并與數據庫進行比對,進而推斷鑄幣者和鑄造年份等歷史背景信息。人工智能可以根據錢幣圖像,評估其磨損程度、光澤、劃痕等,由此客觀分級并初步估算市場價值。相較于人眼主觀性較強的分級過程,未來得到充分訓練的人工智能可能會提供更客觀的評估模式。然而,人工智能的識別依賴于高質量的圖像,光線不足的照片或分辨率低的圖像會影響識別的準確性。識別能力還取決于其數據庫的廣度,罕見或獨特的硬幣有時難以被準確識別。
在錢幣學研究中,“機器看”的效率遠遠超出“肉眼看”,用人工智能輔助模具研究值得期待。模具研究需要收集同一樣式的所有錢幣樣本,判斷相似的錢幣是否使用了同一模具,估算出鑄造這些錢幣使用的模具數量,并根據模具損耗程度和模具關聯性進一步推斷出錢幣的產量,用于研究貨幣需求和錢幣的白銀量等經濟情況。在模具研究的實操過程中,肉眼比較相似錢幣很容易出錯,皇帝鼻梁的曲度和頭發等細節時常令學者眼花繚亂。錢幣學家不僅要核對《羅馬行省錢幣》和《羅馬帝國錢幣》等公開出版的錢幣學目錄,還需要查詢拍賣行的數據庫中更為豐富的樣本。當學者面臨同一樣式的幾十枚甚至成百上千的樣本,肉眼比對變得十分困難,訓練人工智能來實現模具研究十分必要。由于自動化程度有限以及需要進行3D掃描,過去美國錢幣學會使用的半自動計算機輔助模具研究(CADS)方法仍有待改進。法國國家研究署最新的實驗致力于實現自動化的模具研究,將目標定為識別潛在的共同模具而非圖像匹配。人工智能處理數千枚錢幣的鑄幣模具研究只需幾個小時即可完成,而錢幣學家則需要數周時間。
綜上,不論是傳世文獻還是出土文物,人工智能并未取代學者在古典學研究中的作用。“親眼看”文物的時代并未落幕,“機器看”材料的時代已然到來,二者的結合在識讀碳化或纖維層交錯的紙草、錢幣模具研究等領域成效顯著。然而,在歐美國家削減文科經費的大環境下,技術的推廣需要時間,恐怕也并非易事。人工智能究竟是一時熱浪,還是會逐漸嵌入古典學的研究方法,讓我們拭目以待。
(作者:白珊珊,系四川大學古典學系助理研究員)