|
||||
你羡慕那些出口就會吟詩的文人嗎?現在可以不用再羡慕他們了!因為有一位理科生“yixuan”閑來無事,把《全宋詞》拿出來“搗鼓”,算出了其中的99個高頻詞匯。熟記這些高頻詞,你就可以隨心所欲進行創作了!你還可以用“無序”的數字來創作一首“美妙絕倫”的宋詞,圓周率也可以哦!
頻率分析算出宋詞高頻詞
署名為“yixuan”的網友在個人博客裡寫道:“突然想看看宋詞裡面什麼樣的意象是最常見的,比如可以作個頻率分析什麼的。當然文本挖掘需要分詞,我沒法在其中花太多時間,於是想出了一個土辦法。宋詞的句子都很短,如果窮舉可能的字的組合的話並不是太多,況且最常見的詞語一般是兩三個字,這樣可能的組合就更少了。”
比如“猶解嫁東風”這句話,可能的二字組合是“猶解”“解嫁”“嫁東”“東風”,三字組合是“猶解嫁”“解嫁東”“嫁東風”,詞的字數越多,可能的組合就越少。
“如果把每句話可能的字的組合都列舉出來,就可以整體統計頻率了。”大家一致分析這位網友一定是個理科生。
隨後,“yixuan”貼出了他算出來的高頻詞,排在前面的分別是:1.1485、2.東風(1382)、3.何處(1230)、4.人間(1202)、5.風流(857)、6.歸去(812)、7.春風(802)、8.西風(779)、9.歸來(771)、10.江南(765)……至於為什麼第一名是數字,他解釋:“排在第一的是無效字符,這跟數據源有關。”這個結果一出來,一位網友就一語道破了“玄機”,“原來,最流行的宋詞就是‘東風何處在人間’啊!”
生日數字也能改編成詩詞
還有更絕的呢!署名為“達芬奇的雞蛋”的果殼網友不知怎麼地,就想到了拿大家都會背一點的圓周率進行創作,兩個數字一斷,對照高頻詞表,一首“華麗麗”的詞就出來了!還附上了說明,特別像模像樣。
看完這首詞,網友們一邊膜拜,一邊自己的創作靈感也被打開了。
“丘寒”留言道:“試著用某個號碼創作了一首:天上相思,芳草年年,昨夜江南,回首一笑多情。”“零Ronnie”很有創作激情:“我的生日:年年江上,江南春風;我的手機號:明月芳草去年,江南闌乾歸去……還真挺上口的!我也能做詩人了哈哈!”
理科宅男歡呼消滅文科生
可是這麼一來,文科生又不淡定了,一群文科生跳起來反擊。
“雯名霞邇”大叫:“統統拖出去,斬了!這讓學中文的人情何以堪啊!”
“Rockfish”代表理科生還擊:“理科宅男們消滅文科生的日子到來了!拿起你的計算器,消滅文藝青年吧!”“可可”童鞋呼喚:“就讓科技小清新來得更猛烈些吧!”
還有一群網友七嘴八舌地討論著。“沌世界”淡定地說:“不知宋詞的粉絲看了是不是有一種偶像破滅的感覺。”“家傑仕”童鞋也總結道:“文藝男女已經阻止不了技術宅作詩了!”
網友制作的
宋詞高頻詞匯和數字代碼
1 (空) 21一笑41深處61一片81不是
2東風22黃昏42時節62桃李82時候
3何處23當年43平生63人生83腸斷
4人間24天涯44淒涼64十分84富貴
5風流25相逢45春色65心事85蓬萊
6歸去26芳草46匆匆66黃花86昨夜
7春風27尊前47功名67一聲87行人
8西風28一枝48一點68佳人88今夜
9歸來29風雨49無限69長安89誰知
10江南30流水50今日70東君90不似
11相思31依舊51天上71斷腸91江上
12梅花32風吹52楊柳72而今92悠悠
13千裡33風月53西湖73鴛鴦93幾度
14回首34多情54桃花74為誰94青山
15明月35故人55扁舟75十年95何時
16多少36當時56消息76去年96天氣
17如今37無人57憔悴77少年97唯有
18闌乾38斜陽58何事78海棠98一曲
19年年39不知59芙蓉79寂寞99月明
20萬裡40不見60神仙80無情100往事
網友習作
《清平樂·圓周率》π=3.1415926……
(1415)回首明月,(一看就是抒情詩)
(9265)悠悠心事空,(果然,貌似失戀了)
(358979)故人誰知寂寞。(觸景生情)
(323846)風吹斜陽匆匆,(回憶那天下午的艷遇)
(264338)芳草平生斜陽,(平生見過最美的太陽和芳草,都是因為那裡有你的身影)
(327950)風吹寂寞今日。(到現在就剩我自己)
(288419)一枝富貴年年,(好花美麗年年開,好景宜人不常在)
(716939)斷腸長安不知。(我的思念遠方的你可知道)
(注:詩詞後為網友配的說明)
《如夢令·根號二》=1.41421356……
(414213)深處時節千裡,
(562373)消息當年鴛鴦。
(0950)歸來今日,
(488016)一點無情多少。
(8888)今夜,今夜
(724209)而今時節歸來。