• 微信掃描關(guān)注
    紙引未來(lái)網(wǎng)公眾號(hào)

    紙引百科-訂閱號(hào)
  • 紙引未來(lái)網(wǎng)紙張產(chǎn)業(yè)鏈大數(shù)據(jù)平臺(tái)-客服QQ
    客服QQ:1708923858
    客服QQ:3620323674
    客服QQ:401369780
    客服電話:020-82025252
  • 020-82025252
  • 查看抖音

    抖音掃碼關(guān)注

  • 掌上紙引未來(lái)

    微信掃碼

    紙引百科-手機(jī)版首頁(yè)

    手機(jī)版

    紙引百科-紙引行情

    紙引行情

    紙引百科-紙引匯采

    紙引匯采

    紙引百科-智慧熊

    智慧熊

 積分商城 商務(wù)中心 |
 
當(dāng)前位置: 首頁(yè) ? 資訊 ? 印刷新聞 ? 正文

從電子印刷邁向數(shù)字出版的基石——《辭源》用字整理

放大字體??縮小字體 發(fā)布日期:2016-03-11??來(lái)源:互聯(lián)網(wǎng)??作者:紙引未來(lái)
核心提示:
《辭源》第三版修訂工作始于2007年,用時(shí)長(zhǎng)達(dá)8年。其間,恰逢我國(guó)數(shù)字出版從興起轉(zhuǎn)向興盛之際,毫無(wú)疑問,紙質(zhì)版和數(shù)字版都要出,但二者是分步實(shí)施還是一氣呵成,紙質(zhì)版電子印刷數(shù)據(jù)是否與數(shù)字出版接軌,這是一個(gè)無(wú)法回避的問題。

“一氣呵成”的數(shù)字出版策略

單從數(shù)據(jù)層面講,電子印刷相對(duì)傳統(tǒng)鉛字排版印刷只是載體改變,目的還是“印刷”呈現(xiàn),而數(shù)字出版則是全新的理念。

數(shù)字出版是建立在計(jì)算機(jī)技術(shù)、存儲(chǔ)技術(shù)、顯示技術(shù)、網(wǎng)絡(luò)技術(shù)和流媒體技術(shù)等高新技術(shù)基礎(chǔ)上,在內(nèi)容的編輯、制作、發(fā)行、傳播等出版全過程中,將所有信息都以統(tǒng)一二進(jìn)制代碼的數(shù)字化形式存儲(chǔ)。其核心是“一字一碼”,這個(gè)編碼在全球范圍內(nèi)是唯一的,即國(guó)際標(biāo)準(zhǔn)編碼。

為了實(shí)現(xiàn)數(shù)字出版,項(xiàng)目組最終確立了紙、電一氣呵成的出版策略。從電子印刷邁向數(shù)字出版,意味著轉(zhuǎn)變觀念、調(diào)整工作模式和技術(shù)創(chuàng)新?!掇o源》修訂工作原本就時(shí)間緊、任務(wù)重,這種策略的調(diào)整無(wú)疑雪上加霜。為此,專門成立了字形組,對(duì)《辭源》用字進(jìn)行全面整理。

為了在短時(shí)間內(nèi)實(shí)現(xiàn)這一跨越,字形組在主編指導(dǎo)下,制定了較為科學(xué)的技術(shù)路線和實(shí)施方案,從摸清情況、制定原則和技術(shù)實(shí)現(xiàn)3個(gè)層面,分6個(gè)步驟對(duì)《辭源》用字進(jìn)行整理,為實(shí)現(xiàn)《辭源》第三版從電子印刷邁向數(shù)字出版打下基礎(chǔ)。

《辭源》用字面臨挑戰(zhàn)

修訂人員以2010年《辭源》紀(jì)念版為基礎(chǔ),利用其紙質(zhì)版和電子印刷數(shù)據(jù),對(duì)《辭源》用字進(jìn)行徹底清理,從中提取出用字16000余個(gè),并且摸清了《辭源》的用字狀況?!掇o源》初版于1915年面市,距今已百年,由于歷史沉積和印刷技術(shù)條件所限,其用字存在一字多形、新舊并存等現(xiàn)象,這是呈現(xiàn)層面的問題;電子印刷數(shù)據(jù)則存在一碼多字、多字一碼等情況,這是印刷平臺(tái)系統(tǒng)底層的問題。2010年版《辭源》的電子印刷平臺(tái)是以國(guó)家編碼標(biāo)準(zhǔn)GB2312的6763漢字為核心編碼,繁體字和集外字均通過切換字庫(kù)來(lái)實(shí)現(xiàn),這是權(quán)宜之計(jì)。同時(shí),該平臺(tái)為了排版印刷的方便,開放了自造字功能,導(dǎo)致一個(gè)編碼對(duì)應(yīng)多個(gè)漢字和多個(gè)漢字對(duì)應(yīng)一個(gè)編碼的現(xiàn)象頻出。這樣的數(shù)據(jù)無(wú)法實(shí)現(xiàn)有效的信息檢索、準(zhǔn)確的信息傳遞和直接的信息交換,是實(shí)現(xiàn)數(shù)字出版的最大障礙。

《辭源》的字形原則

《辭源》是“閱讀古籍用的工具書和古典文史研究工作者的參考書”,它的主要功能是“用來(lái)解決閱讀古籍時(shí)遇到的關(guān)于語(yǔ)詞典故和有關(guān)古代名物典章制度等知識(shí)性疑難問題”。按照這個(gè)功能定位,字形組根據(jù)10億字古籍語(yǔ)料庫(kù)的用字頻率,并參照《康熙字典》和《中華大字典》等權(quán)威工具書,確立了其字形原則。

依據(jù)《辭源》的字形原則,從字樣、字位、字種三個(gè)層面對(duì)其用字進(jìn)行規(guī)范,對(duì)一字多形、一字多碼、多碼一字等問題進(jìn)行歸一化處理,并從部首、部件乃至筆畫層面對(duì)字形進(jìn)行細(xì)致入微的規(guī)范,確保字庫(kù)的字體形態(tài)符合《辭源》的功能定位,也確保字庫(kù)在整體風(fēng)格上的一致性。

原始數(shù)據(jù)跨平臺(tái)移植

數(shù)字出版的基本要求是一個(gè)漢字應(yīng)有一個(gè)唯一編碼。基于國(guó)際編碼標(biāo)準(zhǔn)ISO10646框架的計(jì)算機(jī)平臺(tái),可以滿足《辭源》“一字一碼”的需求,而且能實(shí)現(xiàn)有效的信息檢索、準(zhǔn)確的信息傳遞和直接的信息交換。因此,對(duì)《辭源》印刷平臺(tái)編碼方式的梳理,并將其用字與國(guó)際編碼標(biāo)準(zhǔn)對(duì)接,是實(shí)現(xiàn)數(shù)字出版最基礎(chǔ),也是最必要的工作。

《辭源》用字與國(guó)際編碼標(biāo)準(zhǔn)對(duì)接后,采取技術(shù)手段將1000多萬(wàn)字的原始數(shù)據(jù)一次性從封閉、不可對(duì)外交換的平臺(tái),移植到基于國(guó)際編碼標(biāo)準(zhǔn)、可交換的開放平臺(tái),避免了繁瑣的人工修改,以及用字上的不一致等問題,移植后的數(shù)據(jù)可直接用于數(shù)字出版。

總體來(lái)講,《辭源》的用字整理工作具有里程碑意義。首先,它不僅解決了《辭源》用字在表面呈現(xiàn)上的規(guī)范一致性,而且還徹底解決了底層編碼的標(biāo)準(zhǔn)統(tǒng)一性,后者則是數(shù)字出版的重要基礎(chǔ)。其次,它實(shí)現(xiàn)了印刷數(shù)據(jù)與數(shù)字出版的無(wú)縫對(duì)接,做到了紙、電同步出版,尤為重要的是,確保了不同出版形式在內(nèi)容上的完全統(tǒng)一,這也是《辭源》數(shù)字版的主要特點(diǎn)。最后,它也為實(shí)現(xiàn)電子印刷數(shù)據(jù)的跨平臺(tái)移植,探索了一條切實(shí)可行的技術(shù)途徑。

事實(shí)說明,《辭源》紙質(zhì)版與數(shù)字版“一氣呵成”的出版策略是正確的、可行的,不但沒有影響紙本正常出版,更有利地推進(jìn)了數(shù)字版的出版進(jìn)程,降低了數(shù)字出版的成本??梢哉f,此次的用字整理工作,是《辭源》從電子印刷邁向數(shù)字出版的基石。

?



【免責(zé)聲明】

1、紙引未來(lái)發(fā)布此信息目的在于傳播更多信息,與本平臺(tái)網(wǎng)站立場(chǎng)無(wú)關(guān)。

2、紙引未來(lái)不保證該信息(包括但不限于文字、數(shù)據(jù)及圖表)全部或者部分內(nèi)容的準(zhǔn)確性、真實(shí)性、完整性、有效性、及時(shí)性、原創(chuàng)性等。

3、如有侵權(quán)請(qǐng)直接與作者聯(lián)系或書面發(fā)函至本公司轉(zhuǎn)達(dá),及時(shí)給予刪除等處理。

?
[ 資訊搜索 ]? [ 加入收藏 ]? [ 告訴好友 ]? [ 打印本文 ]? [ 違規(guī)舉報(bào) ]? [ 關(guān)閉窗口 ]

?
0條 [查看全部]  相關(guān)評(píng)論

?
推薦圖文
推薦資訊
點(diǎn)擊排行