[李宇明]:
第三,語言生活中的若干熱點問題,大概有五個方面:
第一個熱點,漢語漢字的使用空前地受到社會的關注,語言文字不規範的現象引起了社會廣泛的重視。比如說有一個雜誌叫《咬文嚼字》,它找出中央電視臺春節晚會熒屏上的錯別字28處,平均每10分鐘出錯1次。比如說電視節目《跟着媳婦當保姆》裏,妻子說“你瞎攪合什麼呀?”“攪和”的“和”不應該是“合”。
第二個熱點,多家媒體和單位共同組織了“全國報刊邏輯語言應用病例有獎徵集活動”,徵集到一萬四千多份,平均每種報紙的錯誤是46處,每一版的錯誤是5.8處。2006年,《人民日報》曝光了幾部辭書被仿冒的現象,引起了社會熱議。新聞出版總署爲了很好地解決辭書問題,建立辭書出版准入制,希望通過這一措施來提高辭書質量。
(2007-08-16 10:03:37)
[李宇明]:
第三個熱點問題是人名用字。2006年調查,全國姓氏是2.3萬個,其中129個姓氏佔總人口的87%。我們的姓名結構逐漸發生變化,四個字以上的名字出現了,還出現了“趙一A”、“奧斯銳娜王”等極端個性化名字,還有的給孩子報名字的時候就叫@,他說,全世界寫電子郵件都要用它,漢語翻譯過來就是“愛他”。全國6000多萬人的名字有冷僻字,北京市公安局曾公佈了231個人名用字的冷僻字。
少數民族人名的漢字轉寫常常出現名無定字,給少數民族同胞在國內的生活帶來了很大的不便。對此,新疆等地制定了《人名漢字音譯撰寫規範》。現在社會上不少人呼籲儘快出臺《姓名法》或是《姓名條例》,確定姓名結構方式和姓名用字規範。但也有人認爲,公民享有姓名權,有權決定、使用和依照規定改變自己姓名的權利。
(2007-08-16 10:05:15)
[李宇明]:
第四個熱點問題,一些私塾讀經學校興起,中小學有關文言與白話的爭論再起波瀾。
第五個熱點問題,海峽兩岸語言學術交流日益頻繁。2006年,海峽兩岸或是涉及到海峽兩岸的學術交流活動頻繁。海峽兩岸的學術交流對研究解決兩岸語言生活問題有重要作用。兩岸的溝通、兩岸的發展,對祖國統一語言文字非常重要。
(2007-08-16 10:07:11)
[李宇明]:
第四,2006年語言文字使用的一些數據。分五個方面向大家報告:
第一方面,漢字使用的情況。
我們總結爲四個字,叫“穩中有變”。2005年,我們調查了7億字的語料,2006年我們調查的語料大約9億字。這兩年的統計結果如下:使用頻次穩定,比如說2005年覆蓋整個語料80%,只用了581個字,覆蓋語料90%用了934字。2006年的情況是,覆蓋語料80%,用了591個字,多了10個字,覆蓋語料90%是958個字。顯然2006年用字比2005年用的字在語料覆蓋上多了一些。在使用頻率最高的前600個字中,只有21個字不同,前1000字中只有34個字不同。這是06年與05年高頻字比較的情況。
(2007-08-16 10:12:06)
[李宇明]:
除了和05年用字比較,我們和以往發佈的文字規範進行比較。比如前2500字,同過去的一級常用字比較,差距很大,有331個字不在一級常用漢字中。在3500個高頻字與《現代漢語常用字表》比較,有388字不在《現代漢語常用字表》裏。前7000字與《現代漢語通用字表》比較,有517字不在《現代漢語通用字表》中。
比較現在的用字和過去發佈的語言文字用字規範情況說明,我們今天的語言生活已經有了很大的變化。這也給我們提出了一個任務,應該對已有的漢字規範進行修訂和調整。
(2007-08-16 10:14:33)
[李宇明]:
漢字使用叫做“穩中有變”,那麼詞語的使用則可以叫作“變中有穩”。
2005年與2006年比較,使用的相同的詞種數爲586161,分別佔2005年、2006年詞種數的35%、29%,變化率達到65%以上。活躍、變動的詞,主要是低頻詞,如機構名、人名、地名,體現出社會語言生活的豐富多彩。今年我們還嘗試進行了詞性的統計,統計了動詞、名詞、形容詞等等。當然我們的軟件在這方面還不能夠在9億字的語料庫裏自動標記,還有一些問題,這是現在的實際情況。在實用當中名詞最多,其次是動詞、助詞、副詞、形容詞、介詞、代詞、數詞、量詞、連詞。專有名詞數量最大,在整個語言中佔94.86%。這就給我們提出一個重要問題,專有名詞是語言性質的重要組成部分,我國的各種術語中,專有名詞是一個非常重要的部分。
在詞語使用方面我們調出了字母詞使用情況,包括含有字母,也包括和漢字現結合的,不包括外文詞。進入5000高頻詞語的有10個字母詞,例如VS、DVD、CEO等,字母詞佔詞語總數的9%,但使用頻次低。
(2007-08-16 10:15:53)
[李宇明]:
字母詞在語言生活中的作用主要是指代和排序,如A區、B樓、C座。列車車次用K、T、Z、D,汽車牌號中的字母,起指代、排序作用的字母詞,佔全部字母詞種數的73%。
在這次研究當中,我們發現字母詞使用存在着很多問題:第一個問題,大量的異形字母詞存在,比如字母大寫小寫不確定,MP3、soho,有不同的寫法。相配的漢字有不同的寫法,比如DVD盤、DVD光盤,DVD碟、GPS定位系統、GPS導航儀等等,比較亂。
另外,同形字母詞大量存在,比如“PM”,在我們語料庫裏發現,它是表示“下午”的意思,也代表“溜鬚拍馬”的漢語拼音的縮寫。
所以我們認爲,字母詞的使用需要謹慎、需要規範。
(2007-08-16 10:19:27)
|