摘要:本文爬取了古诗文网[1]《唐诗三百首》里唐诗相关数据。首先,分析了唐诗体裁的构成。其次,筛选出唐朝Top5高产诗人名单。然后,分析出不同诗人擅长创作的题材类型。接着,对古诗内容和古诗类型进行内容分析。最后,探讨了诗人寿命和作品产量的关系并给出总结。
“熟读唐诗三百首,不会吟诗也会吟”。想必这句话大家都不陌生,其出自《唐诗三百首》编者蘅塘退士所作原序。
出于义务教育教材的强力推荐,几乎所有人从小就和唐诗有着不解之缘,我说“床前明月光”,下一句你肯定知道既不是“李白睡得香”也不是“地上鞋两双”,而是“疑似地上霜”。
但是今天,我们不复习韵律,也不品派别,就从数据的角度重新认识一下《唐诗三百首》!
一、唐诗基本形式?体裁构成
如下图,《唐诗三百首》按体裁可分为五言绝句、七言绝句、五言律诗、七言律诗、五言古诗、七言古诗和乐府七类。
其中,五言律诗涌现了大量优秀的诗作,数量达到80首,这可能是因为五言律诗具有“二二一”(客路青山外,行舟绿水前)或“二一二”(海内存知己,天涯若比邻)的节拍群,奇偶相配、富于变化、能够更灵活细致地抒情和叙事、语句的表现力强[2]。
在七类体裁中七言古诗收录数量最少,仅有28首。七言古诗作为一种古老的诗体,经历了漫长而曲折的发展历程,在唐代走向成熟。
二、谁著作等身?唐朝Top5高产诗人
按照诗人作品产量由高到低排序,可以得到唐朝Top5高产诗人名单(如下图),他们依次是白居易(3075首)、杜甫(1371首)、李白(1178首)、刘禹锡(816首)和元稹(719首)。
从产量来看,在白居易面前,李、杜也略显逊色。
从代表作来看,白居易的《琵琶行》可谓高考语文常客,其朗朗上口的韵脚、快慢分明的节奏经常让人读着有酣畅淋漓之感,不愧是能让“江州司马青衫湿”的好诗!
杜甫许多脍炙人口的佳句,只读一遍便在脑海里三日不绝挥之不去。例如,“两个黄鹂鸣翠柳,一行白鹭上青天”、“无边落木萧萧下,不尽长江滚滚来”、“会当凌绝顶、一览众山小”、“安得广厦千万间,大庇天下寒士俱欢颜”等。
浪漫主义诗派代表人物李白,其人心胸之阔,桀骜不驯;其诗格局之高,气势磅礴。情极悲愤而作狂放,语极豪纵而又沉着,可谓才气逼人。其代表作《将进酒》、《蜀道难》等乃治疗抑郁之良药,大家失意或者伤心时酌情朗诵两遍,情绪可得缓解!
最后两位诗人分别为刘禹锡和元稹,知名度稍逊于前者。
写到这里顺便给大家科普一下自古以来最高产的诗人——乾隆皇帝。是的,你没看错,作诗量世界古今双第一,一生89岁作诗42250多首[3]。
全唐朝2700多位诗人300年的总产量也只有48900,可见乾隆一人出诗量可挡世界第一诗朝300年的世界记录,且其诗内容遍及经史子籍、政经文教、家国个人,题材弙阔、前无古人、后无来者、不愧是朕。
三、体裁通吃?平平无奇的创作小天才
下图展示了作品量前30唐朝诗人创作体裁的偏好。右边节点越宽说明诗人擅长创作的体裁种类越多。
可以看到在七个唐诗体裁中,李白、杜甫等能创作,不愧是家喻户晓的“大李杜”[4],可谓全能型创作选手。
李、杜之后还有白居易、李商隐、王维、岑参和韦应物,他们的作品体裁也较为丰富。
值得注意的是,这里并不是说其他诗人不写某些体裁,而是写了此类体裁又能被《唐诗三百首》收录的体裁数量,这在一定程度上能够反映出诗人所擅长的体裁种类。
四、 我找到了写诗的精髓?内容分析
分别对古诗具体内容和古诗分类进行文本挖掘,绘制出如下所示的词云图。
01 古诗内容
词云图中的字母“T”由古诗内容的关键词组成,从诗歌的意象来看:“月”、“明月”等关键词出现的频次较高。
古往今来,“月”常被文人墨客作为寄托思念的物象,正所谓望云思友、望月怀人,如杜甫的《恨别》:“思家步月清宵立,忆弟看云白日眠”。
此外,“长弦”、“琵琶”、“青山”、“春风”等物象也经常被使用,在特定场景可象征不同的含义与情感。
从诗歌的时空来看,“万里”、“隔”、“年”等词出现的频次较高,这是因为古代交通不便,以书信作为主要的通讯方式,一旦分离,相见甚难,而诗词中常出现的“见”、“不见”等关键词更加凸显了离人纠结与无奈之感。
02古诗分类
词云图中的字母“S”由古诗类型关键词组成,其中“写景”和“抒情”出现的频次最高。
一般而言,古诗大多写景抒情、触景生情,很少有单纯写景,诗人的境遇、情感一定会与所见之景结合起来。
例如,同样是春天,得意时赏春(留连戏蝶时时舞,自在娇莺恰恰啼),失意时伤春(桃杏娇妍能几日,逝水无情春月明)。
其它较多见的唐诗类型还有,还有“送别”、“怀古”、“思乡”、“边塞”等。
五、为祖国健康写诗五十年?寿命与产量
除了诗人才能之外,还有哪些因素会对诗人作品量产生影响呢?
记得之前看过一篇报道,某院士总结科研成功的经验是因为自己活得比同行久,莞尔之余细想很有道理。因此下图拟合了诗人寿命与其产量的关系。
可以看到,诗人寿命对作品产量具有正向促进作用,平均寿命的增加会带来平均产量的增加。
产量唐朝第一诗人白居易74岁以及前面提到的产量古今第一诗人乾隆皇帝89岁,成功的秘诀原来是才能+长寿呀!
六、总结
综上,本文爬取古诗文网唐诗三百首数据并进行了内容分析,大致得出以下结论:
第一,唐诗三百首里出现次数最多的体裁是五言律诗,最少的是七言古诗。
第二,唐朝诗人中当属白居易最高产,虽然李、杜才气逼人、名声更响,但从产量角度看,均没有白居易秀。
第三,李白、杜甫擅长全部七种唐诗体裁,可谓全能型选手。
第四,唐诗三百首中写景抒情诗最多,且“月亮”这个意象出现频率最高,一般寄托相思之情。
第五,诗人寿命在一定程度上正向影响作品产量,正所谓活到老、写到老。
写到最后,小编已经满脑诗词歌赋,心情澎湃,那就随便来两句。祝大家:五花裘,千斤肉,呸说错了,祝大家五花马、千金裘,浴足皆用茅台酒,余生不挂一丝愁。
好,大家下期见(偷笑)!!!
参考资料:
[1]出于版本原因,古诗文网《唐诗三百首》共收录320首唐诗。原著蘅塘退士版为311首。
[2]唐代诗人里面,谁的五言诗成就最高?来源于:https://zhuanlan.zhihu.com/p/59485245?utm_source=wechat_session&utm_medium=social&utm_oi=841561048036298752&from=singlemessage
[3]见《河南教育:基教版(上)》1994年第7期39-39,共1页。
[4]“大李杜”和“小李杜”,来源于https://baijiahao.baidu.com/s?id=1643999912576563316&wfr=spider&for=pc
数据 | YaJie
文章 | Yajie、璇璇璇璇子
编辑 | 璇璇璇璇子
本文首发于微信公众号“Giao数据" 转载请到微信公众号后台或文章末尾留言处联系原作者!
新闻推荐
中国科学报7月13日消息,最近,“中国65篇数学论文涉嫌批量造假”一事再次引发学术界对论文造假的关注。论文作者中有3名高校...