本帖最后由 羽·凌风 于 2016-8-18 10:00 编辑
来放上翻译,中间有几段英文,因为……实在是翻不动了WWWWWWW
比分子和生态统计还要难懂啊我是认真的!作者的思路清奇!(炸)
原文链接可以在公网下载,内附非常多非常多的图表,想看的可以下来看看,我这里就省略了




The emotional arcs of stories are dominated by six basic shapes
小说情感轨迹的六种基本模式


Andrew J. Reagan,1 Lewis Mitchell,2 Dilan Kiley,1 Christopher M. Danforth,1 and Peter Sheridan Dodds1
1 Department of Mathematics & Statistics, Vermont Complex Systems Center,
Computational Story Lab, & the Vermont Advanced Computing Core, The University of Vermont, Burlington, VT 05401
2 School of Mathematical Sciences, The University of Adelaide, SA 5005 Australia

原文:http://arxiv.org/abs/1606.07772

随着计算机技术的发展,我们已经可以利用计算机来把自然语言、文本数字化用以分析文化的发展。由于人类的感情是共通的,所以我们的故事也往往会形成一些各有特色的情感模式。本研究搜集了1737本小说(来自Project Gutenberg's fiction collection),并用这些复杂的文章归类出了六种情感轨迹的核心模式。我们对样本分别进行优化、线性分解、有监督学习和无监督学习,得到了这些结果。对每一种核心模式,我们还分别找出了最符合的一套小说,并且分析了它们的下载量,看看哪一种模式是最成功的。









哦不但是我还是想要放一张图表!
这是图5君

再让我们看一下图5君的文字
图5所示的每种情感轨迹模式和最符合该模式的小说的下载数量(更多信息请见附录F的图S19)。我们发现前四种模式虽然符合的小说总数很多,但并不是下载量最多的。模式3和模式4的下载量明显较高,虽然不同小说的下载量离散度也很大。这些数据表明,成功的小说确实有能引读者共鸣的感情脉络为支撑。我们发现,灰姑娘类(SV 3)、俄狄浦斯类(-SV 3)、洞中人类(SV 4)和最后再加上一个悲惨结局的灰姑娘类(-SV 4)小说是比较成功的。
喂喂喂,模式1和模式2看起来明明水平更平均一些啊!研究者你都不考虑一下模型3和模型4那几本下载量高的是因为作者写得好而不是因为套路吗!!!
还有说好的模型4下载量高、总数也可观呢,怎么最后结论直接就把它去掉了!模型4要哭了哦!
最后采纳的基础模式只有前六种(模型1、模型2和模型3),加起来……1306本……
也就是说……这个研究……为了证明套路文果然是套路(?),扔掉了25%不符合六大套路的样本!

是说,虽然正文有一种满满的“不符合的我们就不管它了”的感觉,但是至少……
附录还是把被去掉的一些情况以及看起来很扯的拟合曲线也放出来了WWWWWWWW
不然我们还不知道他的拟合有多夸张啊,正文里的图可是很好看的呢!WWWWWWW

其实这篇文献,才是一个套路文吧!那么深的套路!WWWWWWWWWWW


【发帖际遇】:羽·凌风 走在大街上摔了一跤,不但没有幸运地捡到钱,反而不小心丢失了 9F卡币 。

际遇事件仅作娱乐,正式设定请见【DL故事集】
欢迎来到Dragicland,【总版规】请记得要看哦,还有这个也是好东西→如何回复?


回复 3# 狼狗傑

咦,不知道具体的文献情况,那个黑色幽默作家提出的理论其实脑洞向居多吗?WWWWWWWWW

至于说到这篇论文是怎么过审的……
感谢熊搜了一下这个期刊 arVix,发现——

http://zhidao.baidu.com/link?url ... g4xpMQ9EuBRTbvbYBFa
大概它根本就没有被审核过!WWWWWWWWW
这样居然也可以被报出来,果然是想要搞个大新闻WWWWWWWW(哎)
欢迎来到Dragicland,【总版规】请记得要看哦,还有这个也是好东西→如何回复?


这个研究有新进展了!团队不仅拟合了小说,还去拟合电影了!
并且和电影的销量、评价、成本和题材这些做了比较,得到了一些相关性

https://zhuanlan.zhihu.com/p/41540961

虽然用套路来做分类工具,大致判断哪类作品最受欢迎是不错的方法
但是毕竟他们这帮人在分析小说的时候就做过在只把套路作为唯一变量,不管作品自身水平、导演倾向、强行拟合曲线、并直接扔掉不符合期望的样本的事……
进步一点的大概是电影他们计算了平均数(X)
鬼知道他们对电影数据的处理方式是不是也和对待小说一样

羽·凌风 于 2018-8-17 10:21 补充以下内容

原文找到了:https://arxiv.org/abs/1807.02221

发表的期刊是arXiv,和之前一样
但作者不是同一帮人耶,真的不是学生毕不了业了于是套了一下师兄的模板吗?(??)
欢迎来到Dragicland,【总版规】请记得要看哦,还有这个也是好东西→如何回复?

不知道发哪儿?点我!
会员原创
【万音之谷】异界乐声的交响
→【Dragicland】
→【烈火流星】
→【轮回之笼】
📖公众作品
📖 【烈焰山脉】当神话降临时
📖 →【漫威宇宙(MCU)】
📖 →【Type-moon】
📖 →【上古卷轴系列】
📖 →【怪物猎人】
📖 →【DC宇宙(The DC Universe)】
💬其它版面
💬 【断河市】创作与进步之梯
💬 【龙荒山】自然作品收藏集
💬 【长青海】风浪匿迹之平洋
⚙️管理版面
⚙️ 【龙峰山脉】公告发布地
⚙️ 【兽王森林】意见提交处
🏠 返回论坛首页