|
||||
■ 本報(bào)記者 皮磊 近日,北京大學(xué)《儒藏》編纂與研究中心、北京字節(jié)跳動(dòng)公益基金會(huì)、北京大學(xué)教育基金會(huì)聯(lián)合舉辦“北京大學(xué)《儒藏》數(shù)字化項(xiàng)目啟動(dòng)儀式”,北京字節(jié)跳動(dòng)公益基金會(huì)向北京大學(xué)教育基金會(huì)捐贈(zèng)2500萬元,用于支持北京大學(xué)開展《儒藏》編纂與研究工作。與此同時(shí),項(xiàng)目還將通過“識(shí)典古籍”智能整理平臺(tái)推進(jìn)《儒藏》數(shù)字化工程。未來,相關(guān)成果將在“識(shí)典古籍”平臺(tái)上線,并向社會(huì)開放。 北大《儒藏》是重大學(xué)術(shù)文化項(xiàng)目,未來將成為中國歷史上第一部最齊備和完整的儒家思想文化著述的總匯,不論是從歷史還是文化傳承角度來說都具有重要價(jià)值和意義。因此,此次捐贈(zèng)也引發(fā)了行業(yè)密切關(guān)注。 北京大學(xué)副校長(zhǎng)兼教務(wù)長(zhǎng)、《儒藏》工程首席專家、《儒藏》編纂與研究中心主任王博表示,“下一步,我們特別強(qiáng)調(diào)要把重點(diǎn)放在《儒藏》的數(shù)字化整理方案,更方便讓有興趣的讀者使用,滿足當(dāng)代中國人的精神需求,對(duì)整個(gè)社會(huì)、民族、國家都有一種基礎(chǔ)性的塑造力量?!?br> 在北京字節(jié)跳動(dòng)公益基金會(huì)理事長(zhǎng)張羽看來,《儒藏》工程中的很多工作其實(shí)是可以在人工智能技術(shù)的輔助下被解決和提效的。“我們將根據(jù)《儒藏》整理的需求,進(jìn)一步優(yōu)化識(shí)典古籍產(chǎn)品功能,讓專家們可以更加高效便捷地開展工作。未來《儒藏》的相關(guān)成果也將陸續(xù)在識(shí)典古籍閱讀端上線,實(shí)現(xiàn)全民共享,讓中國傳統(tǒng)文化、儒家文化能夠被更多人便捷檢索和閱讀。” 一項(xiàng)持續(xù)多年的事業(yè) 據(jù)介紹,《儒藏》工程是新中國成立以來最大規(guī)模地系統(tǒng)整理海內(nèi)外儒學(xué)典籍的一項(xiàng)基礎(chǔ)性文化建設(shè)工程。2003年,“《儒藏》編纂與研究”工程由教育部批準(zhǔn)立項(xiàng),由北京大學(xué)資深教授湯一介擔(dān)任項(xiàng)目首席專家,北京大學(xué)聯(lián)合國內(nèi)外幾十家高校和科研機(jī)構(gòu)共同承擔(dān)。2004年6月,“《儒藏》精華本”被列為國家社會(huì)科學(xué)基金2004年度重大項(xiàng)目;同月,北京大學(xué)《儒藏》編纂與研究中心成立,負(fù)責(zé)組織實(shí)施《儒藏》的整理編纂工作。 《儒藏》工程分兩部實(shí)施,即《儒藏》“精華編”與《儒藏》全本。其中,先期成果《儒藏》“精華編”收錄了中國歷史上最具影響力和代表性的儒學(xué)文獻(xiàn)——包括傳世文獻(xiàn)和出土文獻(xiàn)510種,以及韓、日、越三國歷史上用漢文著述的儒學(xué)文獻(xiàn)160種,編為339冊(cè)。 目前,《儒藏》“精華編”中國部分510種282冊(cè)全部整理完成,已由北京大學(xué)出版社出版,總字?jǐn)?shù)近2億,中、韓、日、越四國近百所高校近500位學(xué)者參與。全本《儒藏》計(jì)劃收書3000余種(含“精華編”),總字?jǐn)?shù)約10億,將基本囊括中、韓、日、越四國歷史上有價(jià)值的儒學(xué)文獻(xiàn)。2023年4月,全本《儒藏》編纂啟動(dòng),重點(diǎn)推進(jìn)《儒藏》文獻(xiàn)的數(shù)字化整理、智能化利用和網(wǎng)絡(luò)化傳播。 業(yè)內(nèi)人士認(rèn)為,這一工程將使中國擁有一部最齊備和完整的儒家思想文化著述的總匯。 然而,要完成這樣一項(xiàng)艱巨的工程被不容易,其中一些基礎(chǔ)性的工作,如???、標(biāo)點(diǎn)、語義辨析等,耗費(fèi)了專家學(xué)者們大量時(shí)間和精力。實(shí)際上,在項(xiàng)目前期,北京大學(xué)方面也曾嘗試開展古籍?dāng)?shù)字化嘗試,但由于當(dāng)時(shí)相關(guān)技術(shù)尚不成熟,《儒藏》工程編纂工作仍面臨很多挑戰(zhàn)。 幸運(yùn)的是,在人工智能技術(shù)快速發(fā)展的今天,一些數(shù)字化工具的出現(xiàn),大大提高了古籍保護(hù)數(shù)字化工作的效率和質(zhì)量。 據(jù)介紹,經(jīng)過兩年多的發(fā)展,“識(shí)典古籍”平臺(tái)已經(jīng)具有版式識(shí)別、自動(dòng)標(biāo)點(diǎn)、結(jié)構(gòu)整理、??钡壬婕肮偶淼娜鞒陶砉δ??!度宀亍返恼碚邔⑾嚓P(guān)文獻(xiàn)的影像上傳平臺(tái)后,由人工智能進(jìn)行初步整理,專業(yè)人員進(jìn)行校對(duì)及做出更有深度的學(xué)術(shù)判斷,這樣可以大大減少專家在基礎(chǔ)性工作上投入的精力。同時(shí),“識(shí)典古籍”平臺(tái)還開發(fā)了協(xié)作整理的功能,支持以團(tuán)隊(duì)的形式開展工作。“識(shí)典古籍”產(chǎn)品負(fù)責(zé)人王宇告訴記者,古籍保護(hù)與文化傳承一直是字節(jié)跳動(dòng)公益重點(diǎn)關(guān)注的領(lǐng)域。在他看來,古籍保護(hù)項(xiàng)目并不同于其他公益項(xiàng)目,其更需要沉下心來,回歸公益本身?!捌髽I(yè)要做好公益項(xiàng)目,需要結(jié)合自己的資源稟賦,同時(shí)也要關(guān)注社會(huì)需求。我們的優(yōu)勢(shì)在于技術(shù),在于產(chǎn)品開發(fā),以及濃厚的公益文化氛圍。當(dāng)然,這并不是一蹴而就的,從2022年上線到現(xiàn)在,我們根據(jù)用戶反饋和新的需求,不斷對(duì)平臺(tái)功能進(jìn)行優(yōu)化。” 以科技賦能公益 事實(shí)上,在此次捐贈(zèng)之前,字節(jié)跳動(dòng)公益在古籍保護(hù)及數(shù)字化方面已開展了數(shù)年探索。 2021年,中國文物保護(hù)基金會(huì)、國家圖書館(國家古籍保護(hù)中心)、字節(jié)跳動(dòng)公益聯(lián)合開展“字節(jié)跳動(dòng)古籍保護(hù)與利用公益項(xiàng)目”,在古籍保護(hù)、古籍科研、古籍?dāng)?shù)字化、人才培養(yǎng)、古籍活化與利用等方面展開深度合作。字節(jié)跳動(dòng)首批捐贈(zèng)1000萬元,設(shè)立中國文物保護(hù)基金會(huì)字節(jié)跳動(dòng)古籍保護(hù)專項(xiàng)基金,定向資助中華珍貴古籍修復(fù)和專業(yè)人才培養(yǎng)、古籍活化與數(shù)字化等項(xiàng)目,其中重點(diǎn)包括《永樂大典》“湖”字冊(cè)等國家珍貴典籍和特藏文獻(xiàn)。 2022年3月,字節(jié)跳動(dòng)向北京大學(xué)教育基金會(huì)進(jìn)行捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”的工作。字節(jié)跳動(dòng)依托在OCR(光學(xué)字符識(shí)別)、自然語言處理、知識(shí)圖譜等領(lǐng)域的技術(shù)和經(jīng)驗(yàn)積累,以及互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)與研發(fā)優(yōu)勢(shì),研發(fā)古籍?dāng)?shù)字化平臺(tái),利用人工智能技術(shù)加速中華古籍資源的數(shù)字化建設(shè),探索借助人工智能提高古籍修復(fù)、整理工作效率。 2022年10月,由該實(shí)驗(yàn)室研發(fā)的古籍?dāng)?shù)字化平臺(tái)——“識(shí)典古籍”平臺(tái)上線,進(jìn)一步提高了古籍?dāng)?shù)字化進(jìn)程。截至目前,“識(shí)典古籍”閱讀端已經(jīng)上線超過1萬部古籍,并提供圖文對(duì)照、分詞檢索、實(shí)體百科等功能。此外,為進(jìn)一步解決用戶“找不到”“不會(huì)用”等問題,“識(shí)典古籍”平臺(tái)還上線了古籍智能助手。當(dāng)遇到不懂的古文時(shí),用戶可以點(diǎn)擊“問AI”,就能夠看到這句話的翻譯,還可以讓智能助手總結(jié)古文的主要內(nèi)容,提出可供參考的研究問題。 2023年7月,故宮博物院與中國文物保護(hù)基金會(huì)、字節(jié)跳動(dòng)合作啟動(dòng)“古籍保護(hù)與活化公益項(xiàng)目”。此次合作為期三年,致力于開展搶救性保護(hù)及資源轉(zhuǎn)化利用。合作首年,由中國文物保護(hù)基金會(huì)字節(jié)跳動(dòng)古籍保護(hù)專項(xiàng)基金捐贈(zèng)首批資金,用于籌建故宮古籍科技實(shí)驗(yàn)室,進(jìn)行古籍修復(fù)、古籍?dāng)?shù)字化、雕版預(yù)防性保護(hù)、專題展覽及出版等項(xiàng)目,用公益力量推動(dòng)古籍保護(hù)和活化的可持續(xù)發(fā)展…… 這一系列動(dòng)作,讓我們看到了以科技賦能公益的巨大潛力。 除了古籍修復(fù)和數(shù)字化,字節(jié)跳動(dòng)在古籍活化傳播方面也做了很多積極探索。如,依托抖音、今日頭條、番茄小說等平臺(tái),聯(lián)合創(chuàng)作者、圖書館活化古籍,讓古籍以更加輕松、鮮活的方式走向大眾;通過游戲、VR等形式創(chuàng)新古籍體驗(yàn)場(chǎng)景;通過古籍公開課、古籍紀(jì)錄片等方式,用現(xiàn)代的語言講述古籍里的知識(shí)……目前,每天有3000多萬人在抖音觀看古籍內(nèi)容。 數(shù)據(jù)顯示,我國現(xiàn)存古籍約有20萬個(gè)品種,從1949年到2019年共修復(fù)整理出版近3.8萬種,而修復(fù)整理現(xiàn)存的全部古籍可能需要300多年時(shí)間。字節(jié)跳動(dòng)古籍項(xiàng)目運(yùn)營負(fù)責(zé)人陳景收說,“技術(shù)的發(fā)展可以解決很多問題,如果沒有資源壁壘,通過人工智能等現(xiàn)代技術(shù),可能在數(shù)年內(nèi)就能夠完成全部古籍的數(shù)字化工作。從這個(gè)層面來看,用技術(shù)手段造福社會(huì)就是最大的公益?!?!--/enpcontent--> |