|
[中國教育網記者]:
剛纔李司長提到新詞新語的問題,我們是否已經建立了全面的語料庫?如果有了,這些數據是通過什麼渠道發佈的?
(2007-08-16 11:03:27)
[侯敏]:
關於新詞語的問題,要想用計算機,並且用語料庫把新詞語自動地提寫出來,實際是一個非常難的問題。今年的新詞語工作,還是在手工的基礎上,在我們的語言資料庫中先人工提出來,再用機器輸入一遍。
等到明年,比如2007年的數據,我們可能就可以真正地在語料庫中用自動的方法,用自動技術來進行提取。這樣,提取的時候就需要一個很大型的語料庫,而且要有一個儀表。所謂新詞語,新在哪兒呢?就新在它是在一定的時間段以後產生的,在這個時間段以前沒有這個詞,這才叫新詞語。因此我們在用語料庫進行提取的時候,這一段時間以前的語料要足夠大,我們把它進行切分以後,把詞表建立成一個比較大的圖表,再和今年的進行切分,然後進行比對,這些在以前的詞表中沒有而今年有的就是我們提取的新詞語的侯選詞。在這些侯選詞中還要進行人工排查,用這樣的方法來提取新詞語。今年我們想嘗試做這個工作,但06年數據的新詞語還不是計算機提取的。
(2007-08-16 11:03:45)
[王鐵琨]:
目前採用的材料是新詞課題組編纂的材料,目前的170多條是選目。我們感覺到,新詞語研究從上世紀80年代到現在,應該有一個時代的發展脈絡,目前還用這種手工操作的辦法來提取新詞語,顯然是跟不上今天語言發展的現實。而且我們的語料也是有限的,目前大型的語料在9億多語料中,包括15個主流報紙,十幾家網站和有聲媒體的大量的語料中,我們準備嘗試用計算機提取的辦法做這件事情。今天下午,國家語言資源監測研究中心五個分中心的同志要專門來研究這個問題,在一個比較大的語料庫中把這個問題解決得好一點。
(2007-08-16 11:05:42)
[語文世界雜誌記者]:
請問,據2005年和2006年的統計,發現現在漢字使用情況與以往《現代漢語常用漢字表》、《現代漢語常用通用漢字表》都有不小的出入,請問國家語委有沒有打算修訂這兩個文字表?
(2007-08-16 11:07:09)
[王鐵琨]:
目前實際用字和已有的字表發生差異,這是一個比較正常的現象,因爲目前使用的《現代漢語常用字表》和《漢代漢語通用字表》都是國家語言文字工作委員會和教育部、新聞出版署在1988年發佈的。1988年發佈的字表,在今天已經將近20年。當時發佈字表的時候主要依據的材料絕大部分還是手工操作,當然計算機也有部分參與。目前信息技術發展很快,我們用語料庫來提取一些用字的實際情況已經實現了,我們可以用計算機語料庫的辦法來覈查現在用字的實際情況。
(2007-08-16 11:07:42)
[王鐵琨]:
國家語委目前正在研製規範漢字表,這項課題也是2000年國家通用文言文字法發佈之後提出的一個新的任務,國家推廣普通話、推行規範漢字。規範漢字究竟是什麼概念?我們覺得,應該給使用文字的民衆提供一個可靠的、方便的字表,要做這樣的規範漢字表,就需要對以前的各種各樣的字表,比如異體字整體表、簡漢字總表、印刷通用漢字字形表、現代漢語通用字表進行梳理,根據實際用字的變化情況,這些變化情況對字表的修訂會有一定幫助,也作爲我們的參考依據。目前這項工作正在進行中,李宇明司長剛纔介紹了規範漢字表,也回答了相應問題。目前學術的準備和研製已經基本結束,正在做一些行政工作。
(2007-08-16 11:08:42)
[記者]:
從2007年開始,新課程表的修訂人員中增加了語委領導。我想問一下,作爲語委的領導,在新課表、新教材的修改過程中,都有哪些新的舉措和一些建議?
(2007-08-16 11:10:23)
[李宇明]:
新課表是修訂,所謂修訂,就是要根據現在的情況和發現的問題,特別是新教材試用的情況來進行。我認爲,語文教育是一個非常困難的事情,它不完全是語文課或者一個課表能解決的。語文代表着一個人的生活的全部,代表着你的閱歷。當前,我們都很關心我們的下一代的的語文水平問題,剛纔登峯司長也介紹了關於大學生的調查,他沒有公佈具體的數據,如果公佈了,可能更令人驚訝。對於母語的教育問題,無論如何也不能放鬆,再放鬆下去,我們的後代可能不會說話,也不會寫字了,這是一個非常重要的問題。我們這次準備聽取兩個方面的意見,一方面是準備聽第一線教材使用者的調查意見,二是要聽取社會的意見,我們要召開座談會。我們的想法是,我們的語文教學是要我們的下一代更好地過現代的語言生活,包括過好信息語言生活,也包括我們和全世界交往的語言生活,更何況我們還要接觸經典、接觸文化。但是我想國家語委會多方面聽取意見,把意見反映給教材修改組,希望他們能夠在原來的基礎上更科學一點。究竟怎麼樣,今年年底會見分曉。他們也盡了很大的努力,希望在原有的基礎上能夠有所發展。
(2007-08-16 11:12:01)
|