韩日一级黄色片,在线亚洲一区,999精品一区,wwwcom黄,久久毛片免费看,国产综合一区二区,手机在线看片一区二区

您當(dāng)前的位置 : 中國甘肅網(wǎng) >> 書香隴原 >> 要聞

AI助力,破譯古文字“密碼”

2025-06-16 08:42 來源:光明網(wǎng)-《光明日報》

  【一線講述】  

  作者:聶菲(南京大學(xué)文學(xué)院助理研究員)

  古文字,主要指中國商代晚期至秦代使用的漢字。二十世紀(jì)30年代,殷墟發(fā)掘出大量有字甲骨,證實(shí)了商王朝的存在,重塑了世界對中國古代文明的評價。近年,抄有《老子》《詩經(jīng)》等內(nèi)容的戰(zhàn)國竹書呈井噴式涌現(xiàn)??梢哉f,古文字是解讀中華文明基因的關(guān)鍵。

  古文字研究與科技發(fā)展密不可分。紅外采集、高精度掃描等技術(shù)手段極大改善了資料條件,索引、搜索引擎、數(shù)據(jù)庫,為古文字研究提供了巨大助力。如今,AI技術(shù)蓬勃發(fā)展,當(dāng)通過人工智能拼綴上第一片甲骨時,實(shí)現(xiàn)的不僅是技術(shù)突破,更是中華文明根脈的賡續(xù)與新生。

  簡單來講,“破譯”古文字可分為兩步:一是識形,二是讀詞。即先認(rèn)出古文字形體是什么字,再判定其音義,弄明白它在文獻(xiàn)中的含義。如,先認(rèn)出甲骨中“[圖1]”是“王”,再讀懂刻辭與商王有關(guān)。人工智能輔助古文字研究,就是要模仿人類專家的學(xué)習(xí)過程,進(jìn)行“記字形”和“讀古書”的訓(xùn)練。

AI助力,破譯古文字“密碼”

  圖1

  目前對計算機(jī)而言,“認(rèn)字形”十分艱難。機(jī)器學(xué)習(xí)面臨著諸多挑戰(zhàn),包括圖像預(yù)處理結(jié)果不佳、標(biāo)注樣本稀缺、字形實(shí)情極其復(fù)雜等。其中,“數(shù)據(jù)困境”是顯性瓶頸,古文字單字量低,有效樣本密度低,機(jī)器學(xué)習(xí)樣本不足。最近,我所在的課題組參與開發(fā)了“古文字線上書寫系統(tǒng)”,旨在收集專家書寫古文字的動態(tài)路徑,將古文字字形轉(zhuǎn)換成有順序、有方向的矢量線段,為訓(xùn)練計算機(jī)識讀字形提供學(xué)習(xí)參考。

  此前計算機(jī)識圖多從像素角度入手,受圖像質(zhì)量、樣本量、字形復(fù)雜性等影響,特征提取困難,識別率低。為了破題,我們課題組轉(zhuǎn)換了思路——并非讓模型分析靜態(tài)字形,而是通過動態(tài)路徑數(shù)據(jù),捕捉專家的書寫順序和對字形結(jié)構(gòu)的理解,幫助模型像人一樣“思考”如何書寫古文字。我們希望通過提取人類書寫古文字的動態(tài)特征,將人的經(jīng)驗(yàn)轉(zhuǎn)換成可訓(xùn)練的數(shù)據(jù)規(guī)則,從而彌補(bǔ)傳統(tǒng)方法在異體字處理上的缺陷,解決數(shù)據(jù)量不足等問題。

  目前,我們的研究已進(jìn)入初步試驗(yàn)階段,錄入了12825條字形書寫數(shù)據(jù)進(jìn)行前期測驗(yàn)。眼下正在搭建機(jī)器學(xué)習(xí)的模型,相關(guān)代碼達(dá)到萬余行,計算機(jī)累計運(yùn)行時間超過400小時,模型迭代3個版本。從生成結(jié)果看已初見成效,計算機(jī)能成功模仿人類書寫的筆勢、筆順和大致輪廓,但在部件書寫的準(zhǔn)確性、筆畫組合和構(gòu)件位置關(guān)系上,仍有很大的進(jìn)步空間。

AI助力,破譯古文字“密碼”

  圖2

AI助力,破譯古文字“密碼”

  圖3

  例如甲骨文中“千”字有一類形體作“[圖2]”形,是在側(cè)視站立人形“[圖3]”的基礎(chǔ)上,在其腿部加一橫筆分化而來,其書寫順序一般是先寫出側(cè)視身體軀干和手臂,再寫后加的一橫筆:

AI助力,破譯古文字“密碼”

  目前訓(xùn)練得到的機(jī)器書寫路徑是:

AI助力,破譯古文字“密碼”

  可以看出,計算機(jī)已能再現(xiàn)字形輪廓和筆順,但對第二筆的起始位置把握欠佳:第二筆不應(yīng)與第一筆交叉穿出;二、三筆雖順序相接,但筆跡并不相連,即第二筆的終點(diǎn)并非第三筆的起點(diǎn)。

  為修正結(jié)果,我們將在現(xiàn)有試驗(yàn)的基礎(chǔ)上,對機(jī)器學(xué)習(xí)方法和算法結(jié)構(gòu)進(jìn)行調(diào)試和整改。這項(xiàng)工作可能十分漫長,但也蘊(yùn)含著無限潛力。

版權(quán)聲明:凡注有稿件來源為“中國甘肅網(wǎng)”的稿件,均為本網(wǎng)原創(chuàng)版權(quán)稿件,轉(zhuǎn)載必須注明來源。

西北角西北角
中國甘肅網(wǎng)微信中國甘肅網(wǎng)微信
中國甘肅網(wǎng)微博中國甘肅網(wǎng)微博
微博甘肅微博甘肅
學(xué)習(xí)強(qiáng)國學(xué)習(xí)強(qiáng)國
今日頭條號今日頭條號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號:6212006002 | ICP備案:隴ICP備17001500號 | 經(jīng)營許可證編號:甘B2-20060006 | 廣播電視節(jié)目制作經(jīng)營許可證編號:(甘)字第079號增值電信業(yè)務(wù)許可證編號:甘B2__20120010

食品藥品監(jiān)管總局投訴舉報電話:12331 | 互聯(lián)網(wǎng)違法和不良信息舉報電話:12377

主辦:甘肅中甘網(wǎng)傳媒有限責(zé)任公司 | 本網(wǎng)常年法律顧問團(tuán):甘肅和諧律師事務(wù)所(0931-8580115)甘肅天旺律師事務(wù)所(0931-8864528)

Copyright © 2006 - 2024 中國甘肅網(wǎng)(GSCN.COM.CN) All Rights Reserved

網(wǎng)站簡介 | 人才招聘 | 廣告服務(wù) | 聯(lián)系我們 | 違法和不良信息舉報電話: 0931-8960109 0931-8960307(傳真)

分享到