華韻國學網 首頁 國學新聞 文化新聞 查看內容

搜狗

百度

搜狗

360

搜狗

谷歌

搜狗

這裏沒有你找不到的字

國學新聞| 文化新聞

2011-8-25 00:00| 發佈者: 酒滿茶半| 查看: 1166| 評論: 0|來自: 【光明日報】(2011年08月24日 09版)

摘要:    摘 要 我國現有的字庫只收入了 7 萬多字,已無法滿足時代需求。歷經 5 年精心準備的『中華字庫』工程進入研發階段,工程將利用先進的信息技術手段,收集和匯總歷代文獻 ...

  摘 要

我國現有的字庫只收入了7萬多字,已無法滿足時代需求。歷經5年精心準備的『中華字庫』工程進入研發階段,工程將利用先進的信息技術手段,收集和匯總歷代文獻資源中出現過的漢字和少數民族文字,辨析源流衍變,確定每個字形的歷史地位,建立漢字及少數民族文字的編碼和主要字體字符庫。字庫建成後將是開放性的,會及時吸收新的字或字形。

你是否知道?計算機屏幕上顯現的每個字符,背後都有一個對應的被國際標準化組織正式認證的區位編碼。如果字符沒有編碼,它將無法在電腦中顯現和存儲。而這個字符編碼匯聚的地方,就是字庫。

我國現有的字庫只收入了7萬多字,除了遺漏的許多現代漢字外,古漢字和許多少數民族文字也沒被納入進來。而隨着電腦應用的日漸廣泛,現有的字庫已遠遠不能滿足人們各方面的需求。

一條喜訊傳來:歷經5年精心準備的『中華字庫』工程日前正式進入研發階段。

『一套權威全面的字表』

『中華字庫』工程總體組專職副組長張力偉介紹,該工程將利用先進的信息技術手段,收集和匯總歷代文獻資源中出現過的漢字和少數民族文字,辨析源流衍變,確定每個字形的歷史地位,建立漢字及少數民族文字的編碼和主要字體字符庫,重點研發漢字輸入、輸出、存儲、傳輸以及兼容等關鍵技術。

完成後的『中華字庫』預計可編碼字符數在50萬左右,包括漢字古文字約10萬、楷書漢字約30萬、各少數民族文字約10萬。

張力偉表示:『「中華字庫」最終的呈現狀態,就是做出一套權威全面的字表來,然後提交給國際標準化組織,在電腦區位中給每個字編碼,廠商再據此做出字形,從而滿足現實的各種需求。』

『永久的保存和無限的傳播』

上古至今的各種傳世文獻,是中華各族人民的精神財富,具有不可估量的價值。『讓我國的傳統文獻實現「永久的保存和無限的傳播」,是「中華字庫」建成後最重要的意義。』張力偉指出。

張力偉說:『網上已有的一些文獻資料,文字的準確度不夠,還常常出現拼字、空格、替代等,都是因為字庫不完善。古文字中的甲骨文、銅器銘文等,是文化的瑰寶。但由於目前我國的古文字都沒有編碼,導致現在無法對其實現數碼化,錄入時只能轉寫成現代的通行字,轉寫中字的意義損失很大。因此,從長遠來看,要對傳統文化典籍進行數碼化的存儲和傳播,就需要建立一個容量更大的「中華字庫」。』

『「中華字庫」工程完成後,不僅對文字學和文獻學領域貢獻巨大,還將會對我國的整個社會科學研究產生巨大的推動作用。』北京師範大學教授、『中華字庫』工程楷書召集組召集人李國英這樣說。

『工程實施起來不容易』

日常生活中,有人因為名字中使用了生僻字,在上戶口、入學、就醫、出國等各種需要電腦錄入個人信息的場合出現麻煩。據統計,我國不少的行政村名包含生僻字,而為其村民錄入二代身份證信息就會遇到障礙。

『「中華字庫」的研發,本質上雖然是為了傳世文獻的數字出版,但將連帶地解決這些現實應用問題。』張力偉表示。

『字庫工程實施起來並不容易!』張力偉感慨地說:『這需要我們做大量工作。某些字在歷史上無依據,就不能收錄。因此,「中華字庫」工程不僅僅是一個簡單的文字整理,更要對我國傳統文獻進行一番細緻的整理。明清之前的文獻,我們要統統過一遍,明清之後則將選取有代表性的版本,涉及文字量將達二三十億之巨。』

『字庫將是開放性的,建成後並非一勞永逸』

復旦大學教授、『中華字庫』工程首席專家裘錫圭認為,『中華字庫』工程性質比較特殊,其研究對象不僅僅是古今漢字,還包括少數民族文字,其本質上又有很濃厚的技術工程性質。因此,技術和文字這兩部分工作之間如何配合好,是一個關鍵問題。

據了解,在承擔字庫工程的單位中,既有復旦大學、清華大學、中國科學院、中國社會科學院等科研力量強大的高校和研究院所,又有北大方正、漢王科技等技術研發領先的企業。參與字庫工程的研發人員中,既有文字、文獻學的學者,也有漢字信息處理、計算機技術等方面的專家。

裘錫圭說:『按照原計劃,「中華字庫」工程要在5年內完成,時間緊迫。在文字方面,前三四年要做的主要是各種文字的整理工作,後一兩年主要是字庫集成的工作。』

『過去研究文字,是先抄卡片,然後在書齋裏一個字一個字地考訂。然而由於文獻數量巨大,僅僅用傳統手段,「中華字庫」工程是不可能完成的。所幸的是,這幾年,圖像處理技術、數據庫技術和網絡通信技術等計算機高科技手段的出現,為「中華字庫」工程的完成提供了可能性。』從工程論證之初就開始參與這項工作,張力偉對此感受深刻。

對這項工程的未來,裘錫圭先生有着更為深遠的考慮,『「中華字庫」將是開放性的,建成後並非一勞永逸。如果在新發現的文字資料裏出現了新的字或字形(其實,即使是已有資料裏的字,也不可能一次就全部收齊),在相關的研究領域中出現了能夠補充糾正以往研究的新成果,我們就應該及時加以吸收,使字庫得以不斷改進、不斷完善。理想的狀態是,字庫工程完成後,還應有經常性的機構為此提供長期的機制保障。這是很有必要的。』


鮮花

握手

雷人

路過

雞蛋

相關閱讀

最新評論

關於我們| 桂ICP備2022007496號-1桂公網安備 45010302003000桂公網安備 45010302003000

小黑屋|手機版|舉報|網站地圖|華韻國學網|國學經典

掃一掃微信:Chinulture|投稿:admin@chinulture.com

返回頂部