讓每個(gè)漢字都“活躍”在“云端”——透視我國語言文字信息化“新基建”
http://www.ainooo.com2025年04月01日 09:14教育裝備網(wǎng)
“由頁”合在一起是“頔”,寓意美好;“韋華”合起來是“韡”,寓意光明盛大……名字蘊(yùn)含著父母對孩子的期待。
曾經(jīng),這些寓意美好的生僻字,卻因無法在電腦里輸入為當(dāng)事人帶來許多困擾。從出生建檔、上戶口、辦理身份證、銀行卡到醫(yī)院掛號……數(shù)字時(shí)代,我們該如何守護(hù)那些被困在信息系統(tǒng)“盲區(qū)”的漢字?
時(shí)序更迭,變化悄然而生!氨本┐髮W(xué)作為國家語委中文文字字體設(shè)計(jì)與研究中心的依托單位,設(shè)計(jì)開發(fā)國家重大基礎(chǔ)性規(guī)范《通用規(guī)范漢字表》的配套字庫,研制人口信息生僻字超大字庫解決方案,在第二代居民身份證、護(hù)照上應(yīng)用,協(xié)助解決銀行、稅務(wù)等社會應(yīng)用系統(tǒng)的人名、地名缺字問題!北本┐髮W(xué)王選研究所所長湯幟說。
近年來,教育部會同有關(guān)部門推動研制并發(fā)布了《信息技術(shù)中文編碼字符集》等國家通用語言文字和民族語言文字信息化規(guī)范標(biāo)準(zhǔn)100多項(xiàng)。2023年,新版《信息技術(shù)中文編碼字符集》增錄1.7萬余生僻字。
這只是語言文字信息化發(fā)展的“冰山一角”。
“語言文字工作是國家綜合實(shí)力的重要組成部分,在國家治理和戰(zhàn)略規(guī)劃中具有重要地位和作用。我們充分發(fā)揮語言文字作為信息載體的重要作用,大力提升國家戰(zhàn)略服務(wù)能力。”教育部語言文字應(yīng)用管理司副司長王暉說。
夯實(shí)根基,如何讓語言文字賦能中國特色大語言模型技術(shù)創(chuàng)新應(yīng)用?首先讓國家語料基礎(chǔ)設(shè)施建設(shè)成為當(dāng)前語言文字信息化發(fā)展的“新基建”。近年來,教育部推動建成國家語委媒體語言語料庫、冬奧會多語言術(shù)語庫、公共服務(wù)領(lǐng)域譯寫規(guī)范術(shù)語庫、規(guī)范標(biāo)準(zhǔn)課程庫等30多項(xiàng),上線國家語言資源服務(wù)平臺、中國語言文字?jǐn)?shù)字博物館、中國語言資源博物館數(shù)字展區(qū)等,服務(wù)國家戰(zhàn)略發(fā)展。
服務(wù)群眾,如何讓語言文化優(yōu)質(zhì)資源惠及更多人?教育部推動打造“掌上可學(xué)、好玩好學(xué)、人人能學(xué)”的新時(shí)代全民學(xué)習(xí)新課堂。上線的“中華經(jīng)典資源庫”和“中小學(xué)語文示范誦讀庫”被譽(yù)為“最好聽的語文”,惠及全國約1.6億中小學(xué)生和上千萬教師及社會大眾。
貫通歷史,如何借助數(shù)字化技術(shù)讓傳統(tǒng)語言文化火起來?教育部推動中國語言文字?jǐn)?shù)字博物館建設(shè),在數(shù)字賦能下,書寫在古籍里的文字“活”了起來。支持相關(guān)單位聯(lián)合開展古文字?jǐn)?shù)字化研究,開通甲骨文數(shù)據(jù)平臺,傳承中華優(yōu)秀傳統(tǒng)文化根脈。
面向全球,如何推動語言文化國際交流互鑒?教育部多領(lǐng)域推動語言文化資源共建共享,建成中華思想文化術(shù)語數(shù)據(jù)庫,面向國際傳播1200多條中華民族話語體系中最核心最本質(zhì)的思想文化術(shù)語,并與40多個(gè)國家和地區(qū)開展多語種數(shù)字版權(quán)合作。建成集成化、智能化、國際化的全球中文學(xué)習(xí)平臺,用戶超1600萬人,覆蓋190多個(gè)國家和地區(qū)。
令人矚目的成就背后亦不乏高校身影。教育部、國家語委依托高等學(xué)校,在全國布局建設(shè)了中國語言智能研究中心、多語種信息技術(shù)研究中心、語言技術(shù)與數(shù)字經(jīng)濟(jì)研究中心等語言科技研發(fā)方陣。清華大學(xué)、北京大學(xué)、哈爾濱工業(yè)大學(xué)等高校開展語言文字信息技術(shù)深度研發(fā);北京師范大學(xué)古漢語大語言模型上線;廣東省教育廳依托廣州大學(xué)成立國家語言服務(wù)與粵港澳大灣區(qū)語言研究中心,利用語言技術(shù)賦能語言服務(wù)、語言生活、語言規(guī)劃、語言政策學(xué)術(shù)和咨詢研究,承建國家語言資源服務(wù)平臺……
著眼未來,教育部、國家語委、中央網(wǎng)信辦共同印發(fā)《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語言文字信息化發(fā)展的意見》。將數(shù)字中文建設(shè)作為服務(wù)數(shù)字中國建設(shè)的重要任務(wù)和全面推進(jìn)語言文字信息化發(fā)展的突出重點(diǎn),全方位釋放語言文字的數(shù)據(jù)要素價(jià)值、全環(huán)節(jié)發(fā)揮語言文字的資源功能作用、全領(lǐng)域推進(jìn)語言文字服務(wù)經(jīng)濟(jì)社會發(fā)展,著力推進(jìn)中文數(shù)字化與數(shù)據(jù)中文化,著力推進(jìn)創(chuàng)新應(yīng)用與規(guī)范安全,著力推進(jìn)新型中文服務(wù)體系構(gòu)建與語言文字治理體系完善。充分發(fā)揮語言文字作為國家重要教育資源、科技資源、文化資源、經(jīng)濟(jì)資源、安全資源和戰(zhàn)略資源的功能作用,實(shí)施數(shù)字中文服務(wù)教育、科技、文化、產(chǎn)業(yè)、社會等重點(diǎn)領(lǐng)域的五項(xiàng)專項(xiàng)行動,助力中文發(fā)揮立德樹人的基礎(chǔ)作用、推進(jìn)科技創(chuàng)新的支撐作用、傳承中華文化的根脈作用、賦能產(chǎn)業(yè)升級的關(guān)鍵作用和服務(wù)社會需求的民生作用。
“可以看出,從‘夯實(shí)根基’到‘著眼未來’,經(jīng)過多年努力,語言文字信息化以應(yīng)用為導(dǎo)向、以服務(wù)為主線,形成了多語種資源廣泛開發(fā)、多方面技術(shù)創(chuàng)新應(yīng)用、多類型主體共同推進(jìn)、多維度賦能發(fā)揮作用的良好局面,有效服務(wù)經(jīng)濟(jì)社會高質(zhì)量發(fā)展!苯逃空Z言文字信息管理司司長劉培俊說。
本報(bào)北京3月31日電
責(zé)任編輯:董曉娟
本文鏈接:TOP↑