本篇文章1994字,读完约5分钟

在中国四大名着中《红楼梦》有非常特别的位置 但是,其作者的归属依然是个谜,不同学派的争论不同 1920年,胡适先生是“大胆的假设”,认为后40次不是曹雪芹写的,而是高鹈鹕续书。 周汝昌认为“红楼梦”一共丢失了108次,现存80次,后28次。 白先勇认为没有人能做红楼梦。 后40届中作者笔触细腻,前后呼应,120人回应全系曹雪芹所为。 关于续作的文学价值,红楼梦《发祥友》张爱玲不这么认为 她认为后十次是“狗尾续貂,排骨蛆” 读了第81回《占旺相四美钓游鱼》,就像用“天日无光,千方百计”进入了“另一个世界”。 很多人各有各的话,但学术界还没有定论 今天熊带着大家读石头记,试图从数据观察的角度提出一些佐证。 从前的80到40次:红楼一梦,比尔想知道红楼梦的作者,首先需要知道红楼梦 阐述红楼梦嘉、史、王、雪四个大家庭的兴衰,勾结贾宝玉、林黛玉、雪宝钉恋爱结婚的主线。 “嘉假,白玉为堂金做马。 阿房宫,三千里,不能住金陵一史。 东海百玉床不足,龙王请金陵王来。 丰年大雪,珍珠如土金,如铁”是对四大家族鼎盛时期判决书的描写 从红楼梦前的80次回到40次,发生了什么? 简单来说,从以前的80到后来的40,是四个大家庭“大楼颓废”、贾宝玉和林黛玉恋爱悲剧的重要过渡。 让我们先看看故事的主人公 第一次读红楼梦,最难的是弄清楚人物关系 红楼梦中眼花缭乱的宗亲关系,常常使人置身云雾之中 在这里,如下图所示,剥茧,只提取前十位的登场人物和他们的登场比例。 贾宝玉登场的比例最高,着墨最多 有点意外的是,下一次出场的不是钏黛,而是嘉府的封建监护人代表,嘉母和凤姐。 贾母在书中有着重要的地位,她是贾府内最高权力的代表 这位老人不仅知道享受荣华,而且在嘉府颓废的时候,她拿出财产救济大家,秩序井然,沉着冷静 凤姐可以说是嘉府的“执行董事”。 显然是火,暗的是刀 她掌握着嘉府的实权,但人心冷酷,最终机关计算不完,终于难免含羞而死 除了前三位代表外,网民最关注的是贾宝玉、林黛玉和雪宝钗之间的恋爱婚姻悲剧 从前80次回到后40次,三个人说了什么话? 让我们来看看三个人出场密度的统计 可见前40届中宝玉、黛玉的步伐更一致。 这时黛玉刚来嘉府,和宝玉一点也猜不到。 中期的三个人物描写都在减少,此时重点是嘉府整体的宏观描写。 在后80届,3人出场再次达到了高峰 其中关于黛玉的描写,100次左右就失去了观众的视线 这时最大的情节变化是“林黛玉焚稿断痴情”,这是悲剧发生的时候。 黛玉听到远处传来的结婚喜悦,心里孤独悲伤,但却成了这个世界最后的俗缘 这一段描写很感人,她烧的是诗稿,也是自己的诗魂 关于雪宝钉的记述在100次后达到了高峰,这时她已经成为了“离开闺房大礼”,嘉府的权利代表赞同的媳妇,将来等待她的整个家族的重担 这里的钏黛之争应该观察到没有发生明显的正面冲突,这与凤姐瞒天过海的策略有关,整个婚姻事实都被贾府高层控制,这也是悲剧的源头。 接下来,让我们看看从80次前到40次后,人物关系是如何变化的。 人物都在自然的段子里,可以看作是网络连接一次,描绘1-40次。 40-80次; 80-120次人物之间的“社会交往网络”(线越粗,关系越强) 很明显,主要人物的关系逐渐加强,第三部分走向了高潮 这时,四大家庭的“突然喇合像大楼一样倒下”,一时大家互相关联,一个也没幸免。 回顾曾经盛况空前的大观园,叹了口气 最后,让我们看看红楼梦中的小人物 红楼梦是群像小说 除了主人公外,作者对小人物的描写非常逼真 比如焦大,他是嘉府的老仆,全书只出现在第一次和最后 但作者借他的醉骂,已经表明了嘉府颓废的势头:曾经唐一时,现在子孙不肖 除此之外,令人印象深刻的刘进姥大观园也是神来之笔 曹雪芹能写富贵人物像贾母一样风流贵族,写村里女性形象也是入木三分钟 刘姥姥进入大观园的视线,让网民体验了大观园盛时多么豪华。 嘉府战败时,刘姥再次出现,救了巧姐 80次后,作者对小人物的描写也非常传神,这与前面我们的结论一致,后面的40次作者主要解决贾府内部主要人物之间的矛盾。 文嚼字,《石头记》的作者是谁? 1数据观察检查表明《红楼梦》作者的归属由上分析表明,红楼梦前后情节出现了很大变化,后40次作者更关注主要人物之间矛盾的解决,减弱了线条人物的描写。 其次,作者可以“咀嚼”在用语习性方面前后是否一致。 在统计学上,评价作者前后的用语是否一致,我们自然地结合“统计检查” 在此,将整体分为1~40次、41~80次、81~120次作为对象 前两个整体对象是参照。点对应于后面两个整体的差异。 我们把一章的词数作为一个观测,用t检查了不同整体之间词数平均的差异(注:这里要求这些词不能用三个整体的词数全部<。 30 ) 让我们看看具体的结果。 首先关注【高频词汇】。 经过统计检查,红楼梦前后用语出现大断层的高频词集中在形容词、副词方面(动词、前置词、接续词等方面没有太大差异,这里不列举详细结果)。 有些频率明显减少的词语越来越多,难道是偶然,从来没有,原来 ①越来越多:大家都慌了 (第25届)那个麝月等慌了神,回过凤姐姐几次 (第九十五届)②? (第23届)雨村低头半天,突然笑了。 “他有遗腹子,能出人头地吗? ”。 (第120届)③不巧:宝玉碰巧去了黛玉那里 (第六十届)正好王夫人送周瑞家照顾(第一百零三届)? (第三届)贾母说。 “我活了80多岁,自己做了一个女孩,然后来到你父亲手里,多亏了祖先,我什么都没听说过。 (第106次)⑤原说:“凤姐儿是‘大丈夫本来就安静地养育着的’。 “(第十一届)“两个爷爷的病本来就很好。 “(第105次)除此之外,统计验证了文献[1][2]的要点词汇。 在名词方面,“maidservants”显着减少。 动词中“目不转睛地看”的现象明显增加。 副词中“越来越少”,同义词中“更多”增加,“刚才”增加 值得注意的是,虚词中的句末虚词和文言虚词两个类别发生了显著的变化 在文尾虚词中,疑问句式结束的语气语在增加,这有可能导致以后40次对话的增加。 单词文言虚词在后40次大部分减少,证明后期语言接近白话 以上词汇以外的词汇在统计上没有明显变化的证据 最后,从文案组织方面对段落长度、标点符号构成进行了统计验证 在这里,我们发现后40次段落的长度变长,句号、双引号、问号增加了。 这导致后面40次人物对话的增加 2复论参考系:从统计检查的角度谈红楼梦作者的归属。 没有参考系。 本节开头证明参考了最初的40次和41~80次语言特征的连续性实际上,从前面的统计检查结果来看,前面80次的语言风格是比较统一的 但是,在这里似乎不能完全说服我们。 在通常的章回小说中,语言风格出现变动是正常的现象吗? 根据故事、感情的变动,小说的复印件采用出现差异也许不是“奇怪”的现象 看看其他章回小说怎么样。 这里包括我们以前讨论过的章回小说,以《倚天屠龙记》为参考(很明显这本小说没有作者的争论,感兴趣的网民可以自己分解其他章回小说)。 同样,我们依靠天屠龙记分为三个整体,验证了内容词、虚词等方面的差异 结果如下表所示,我们没能找到非常显着的整体差异 这证明《依靠天屠龙记》的小说作者在前后用语的习性上比较统一 三回归分解:“智能”能区分前80次和后40次吗? 最后,我们进行了“鬼畜”的回归分解 首先将一个章节看作一个观测,前80次的所有章节记为y=0,后40次记为y=1 一个自然的问题是,通过回归分解,“智能”能否区分前后整体。 删除了一些可能与情节相关的词语,经过变量选择保存了6个词汇,但它们大部分是文言虚词,回归系数如下表所示:关于模型的预测性怎么样? 我们进行了五折交叉验证,预测集平均auc达到了95.4%! 这证明根据用语的特点可以非常清楚地区分红楼梦前后的差异 可以说红楼梦这部小说包罗万象,从数据观察的角度来看作者的归属只是其中的一面 红楼梦中有很多语言的特征,其复印件自古以来就有很多争论 相关术语:在评估显著性时,不再以p值小于0.05为基准 这是这里关于“多重检查”的问题 简单来说,在涉及多个组的假设检查的情况下,将显着水平设定为0.05是不合理的 在此,进行bonferroni修正,根据总检查组数调整p值 本例一共涉及几十组检查,因此为了采取慎重性,p值<; 0.001的词汇 对多重检查感兴趣的网民也可以知道多重检查专用的fdr方法,所以这里不做说明

来源:彭博新闻网

标题:时讯:数说红楼:揭秘《红楼梦》作者之谜

地址:http://www.pks4.com/ptyxw/17014.html