豆瓣怎么评分评分是怎么计算出来的

【咨询】豆瓣上评分达到多少,才算好电影,才值得看?_电影吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:6,668,979贴子:
【咨询】豆瓣上评分达到多少,才算好电影,才值得看?收藏
马尔代夫、泰国、中国、马来西亚多国酒店全部订一晚送一晚,3天限时优惠
有的1分也值得看,有的9分也不值得看
人家觉得好你也一定会觉得好么
豆瓣上高分也不一定你会喜欢。。
一般过了6.8分就可以看看
有的好电影怎么也看不下去
只要不是负的都行
6分里也能找到不错的,7分里也有不咋样的
魅族PRO 6s手机直降200元!给你多买一双新鞋、一条新耳机的理由!
看自己口味啦 再马个十五字 这样肯定有十五字了
评分高不一定好看。很多都是水军刷上去的
我觉着每个人想法都不同。。。自己喜欢就好。。
豆瓣不可信
6.5分以上可以考虑看
国产6分以上,国外7分以上(R级喜剧除外)
豆瓣的打的分的确挺准
但豆瓣有个通病 就是各种优越和自认文艺
很多好片本可以打8分以上
却打5、6、分的电影也不少
我觉得,小清新和日系动画片要自动减1分,动作片大部分要加1分。
6分以上都基本能看。
里面水军5毛多的很
建议想去影院看片时先在网上查查看这片导演
演员是什么类型风格的片子在选择吧
微薄什么的也有很多5毛水军啊 当谨慎...
吗的这些2B垃圾
无孔不入啊...
血腥暴力等等不和谐片自动加1,其它片自动减1
大约打三颗星的比例在50.632987%以上,就能看
都看豆瓣250,哪个好看再看看下面推荐的
刚看了一个豆瓣7分多的,波拉特。感觉很不错啊,可以8分多啊~
刚看了一个豆瓣7分多的,波拉特。感觉很不错啊,可以8分多啊~
要有自己的品味好不好?干吗非得根据别人的评分去看电影?是你看还是你替别人看?
动作片的话只要超过6.5我就看~~~~
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或豆瓣评分风波背后的统计常识思考--百度百家
豆瓣评分风波背后的统计常识思考
分享到微信朋友圈
从统计学上看,批判豆瓣的文章存在逻辑误判,忽视了基本的统计常识,但这场风波背后,还透露出公众对数字过高的期待,以及背后多元化表达所带来的冲突,但这也提醒我们正确地认识数据,科学地思考问题。
关于豆瓣评分拖了国产电影后腿、恶意差评破坏了电影环境这一事件,大家的评论已经够多,但大家的评论基本还是针对观点发表观点,还没有看到从统计角度来谈“评分”本身这件事,因为我平常在课堂上讲统计学,最近又关注电影研究,所以自然就想到这里面其实有不少统计的基本常识值得说,记录下自己的想法不为参战,只是为以后的课堂教学留下点案例资料。
一、研究假设不等于结论,需要收集数据去证伪原假设
从人民日报客户端的文章内容来看,“恶意差评”拖累“电影票房”只能被称为是一个假设,而且是未经验证的假设。对于任何人来说,在收集到充分的证据之前,当然可以做出任何的假设,但这篇文章提出的假设在统计学只上被称为是研究假设,按照统计逻辑,需要把这个研究假设转换成H0“原假设”(虚无假设)以及对应的H1备择假设。因为归纳法收集的证据无法证实,所以我们应该尽力收集证据去推翻原假设。但作者显然并不懂这个逻辑关系,所以把“研究假设”直接当成了结论,虽然作者也举了一些例子证实评分有猫腻,即便属实,这些例证无法推导出评分高低与电影市场的关系。
如果按照统计学原则来研究这个问题,比如我们觉得“恶意差评”拖累“电影票房”,那么我可以列出原假设和备择假设,原假设通常被称为虚无假设,是假设两者之间没有关系,所以:
H0原假设:电影评分与电影票房之间没有联系
H1备择假设:电影评分与电影票房之间有联系
然后我们要真正收集数据,看看是否有足够的信心去推翻原假设。要收集什么数据?自然是收集两个变量的数据,一是电影评分,二是电影票房,这个数据收集过程相对简单,2016年度上映的电影到目前为止将近300部,每部电影在豆瓣上都有一个评分,同时这将近300部电影的票房也都有公布,这两个变量之间至少可以做个相关分析,看两者之间是否存在显著相关,若显著相关,再看是正相关还是负相关,以及相关系数绝对值的大小来判断两者之间的关系。这些数据不难收集,计算也并不复杂,有心的朋友可以试一下。
而作者在这其中犯的错误,则是直接把自己的假设当成了结论来用,而且即便依然把它放在假设的位置上,所收集的证据即便再多,因为采用了归纳法,所以也永远无法证实这个假设。
二、相关关系不等于因果关系,确定因果需要实验设计
如上所述,经过统计计算,即便两者之间存着强相关关系(不论正负),也不能推导出评分数据导致票房数据,因为相关无法推导出因果关系,因为也有可能是票房数据导致了评分数据的变化,还有可能是两者共同受第三个未知变量的影响,这是统计学的基本常识。要确定因果关系,必须得通过实验设计才能得出。
我们这边的一个硕士研究生,目前正在准备的毕业论文主题就是研究这个,所以她需要设计好自变量和因变量,控制其他无关变量,看影评如何影响人们的观影选择,只有这样较为严格的实验设计才能确认因果。
不过,即便是实验数据支持因果关系的假设,能不能说现实中两者就一定是因果关系,似乎还是不好说,因为实验涉及的变量是有限的,为了更好地控制实验,大量其他影响因素被排除在外,那么如果纳入其他影响因素,可能结果会有变化。所以实验法存在的最大问题在于效度较低,不符合现实实际情况,仅在实验条件下可以成立,但是可推广性值得三思。
由此可知,人民日报客户端的这篇文章只是提出一个“臆想”,并没有采用有效的统计方法去验证,所以只能是个人的一种观点而已。
三、电影评分表面上看是数字,其实数字背后站着一个人
电影评分是单纯的数字,但数字的背后并不单纯,每个数字之后都站着一个活生生的人,我在课堂上经常强调说:做数据统计,不能光看数字,还要看到数字背后的人。也就说所,电影评分其实是一种行为数据,一部电影有三万人打分,背后就站着三万个评分员,这些评分者在打分的那一瞬间到底在想什么,我们无从得知,也有可能因为与女朋友吵架正在气头上,就会影响到情绪而给一部电影打出差评。所以不能迷信数字,更不能迷信汇总后的数字,“汇总后的数字”是相对“原始数据”而言的,比如某部电影有三万网友参加评分得到4.9分,4.9是就是个汇总数字,这三万个网友每个人的打分就是原始数据,其实我们更应该看这三万个人的各自打分,可惜数据量太大,看不过来,或者一下子看不明白,所以要汇总,可是一汇总也很容易出问题,其实最容易出的问题就是下面第四点要讲的。
另一方面做为行为数据,电影评分是个人的主观感受数据:我对两部电影都打了4分,我对这两部电影的看法完全一致吗?两个用户都打了4分,难道他们对这部电影的看法就完全一致吗?我相信两个对同一部电影都打4分的用户,他们两人谈起来时,关于这部电影会有很多不同的看法。所以我们看着一个数字的时候(比如“4”)觉得很精确,其实这是一种相当模糊的心理感受。就算我经过严格精密谨慎地判断打了4分,很难说我会把这4分的评价维持终生,极有可能在人生的不同发展阶段,我们对同一部电影的看法会发生变化,如今被奉为经典的大话西游当年不也是票房惨败嘛,时过境迁,心绪难平,每个人基于主观感受的评分总是在动态变化中的,所以不能把数字当成一个明确的永恒的数字。
四、平均分虽然最为稳健,但却抹杀了数据的差异
平均分是一个很容易引起争议的统计指标,近年来无数新闻争议背后就是平均值在捣鬼,但当前的电影评分依然是采用平均值。平均值是用来称量数据集中趋势的一个重要指标,因为在运算过程中使用了每一个数据,所以它综合的数据信息量最大,虽然说它会受极端值的影响,但是样本量越大,这种影响就越小,所以也可以说它是最有代表性指标,豆瓣创始人的回应其实主要就是基于这样的逻辑,来解释为什么用户打了极端值却看不到前端数据有任何的变化,因为你一个人打的分,被另外三万个人给中和掉了。
但是平均值存在的问题也是极其明显的:因为它追求集中,所以自然忽视差异。比如有两个用户打分,可能会有以下几种情况:第一种情况,A打了1分,B打了5分,平均是3分; 第二种情况,A打了2分,B打了4分,平均是3分; 第三种情况,A打了3分,B打了3分,平均是3分。我们看到这三种情况,均值都是3分,可是这三种情况明显有着非常大的差异。所以严格地从统计学来说的话,除了平均值外,也可以考虑其他指标,集中趋势和离散趋势都有很多指标可用,至少每个评分应该再加上个标准差吧。
其实最理想的情况,是不单单公布最终汇总的平均值,而是同时公布原始数据,有多少个人打1分,有多少人打2分,有多少人打3分……甚至把这些原始分值还可以按照时间轴排列,以便看到纵向的变化趋势,当然这对于平台方来说,加大了很多工作量和成本,但这样做显然更加客观公正。
五、所有用户一人一票,还是专家以一抵万更靠谱
与豆瓣同时被批判的,还是猫眼的专业评分,不过令人啼笑皆非的是这,这两者的评分体系分别代表着两种背道而驰的方向,豆瓣坚持的是众生平等一人一票,哪怕你是专家,你的评分也跟其他普通网友一样只能是代表个人的一票而已,猫眼专业评分则是专家评判机制,也就是说猫眼认为专业评分应该独成体系,或者他们的评分与普通观众有差异,所以他们的评价会给予更大的权重。这其实在统计学是就是绝对平均和加权平均的差异。那么问题来了,加权的依据是什么,权重的大小又有何依据?而这些问题不是数据本身能说明白的,所以被质疑也是理所当然的事。
不过话说回来,专家和普通观众的评分差异应该是正常的吧,如果对每部电影来说,专家评分和大众评分都完全相等,那倒是怪事儿了。专家有专家的角度,大众有大众的角度,难道差异就不正常吗,所以我要容许差异的存在,但要理性客观地看等专家和大众各自给出的打分数据。其实今年的美国大选中也是遇到了这个问题,从大众票选结果来看(也就是一人一票),希拉里获胜,但美国的选举制度是选举人票,也就是说各各选区胜出者将得到该选区的全部选票(其实就是加权数据),所以从选举人票来看,特朗普获胜。不过既然选举制度是这样规定的,那就按既定的规矩来就好了,虽然也有怨言,但也没什么大不了。
六、评分只是数字,要重视口碑但不能过分看重评分
就像美国大选一样,即便你不喜欢特朗普,不过既然选出来了,那就这样吧,没什么大不了。总统虽然重要,但所有人都知道,总统一个人也难以真正有什么重大的改变,整体体制的运转是有自己的规律在的。而且不就是四年嘛,四年之后咱再换不就得了,况且鬼知道这家伙干得怎么样呢,成一他干的不错呢?对于总统选举这件大事,我们看得很开,但为什么对于电影评分,我们就这么看不开呢?不就是个评分嘛!难道对某部电影评分低,真得会把电影导演咒死?要真这样的话,广大网民早就用舆论为雷某报了仇了。
重视电影口碑是对的,通过电影口碑的分析,收集各种意见,其实是获取反馈的过程,传播回程有了反馈才会调整使得目标更为精确,当然这是针对商业电影而言,非商业电影另有追求,可能就是拍给自己看的,所以也并不求公众反馈。有了反馈是好事,可是如果太在意别人的看法,自己会活得很累,别人只是不经意间看了你一眼,你就开始孤单思念甚至相信前世有约,这真叫有病。观众在网络上打分的时候,我相信多数是轻描淡写就那么随意给个分数吧,你还真当回事儿还发到人民日报客户端也真是让人醉的不行不行的。
七、评分风波背后,阶层的差异及其表达需求要重视
既然统计学要透过数字看明白背后蕴含的意义,那么此次评分风波背后,更应该重视其实是阶层的分化,以及分化的阶层强烈的表达欲(阶层这个词我并不认为是一个恰当的词,不过是在这时借用一下)。日益多元化是当前中国社会的不争事实,不管是收入、利益、动机、兴趣、关注点还是价值观都是日趋多元化,我们不去讨论多元化是好还是坏,但多元化的群体之间总会有不同的观点,观点的碰撞自己生成舆论的冲突,当前我们说舆情事件层出不穷,导致网络舆论此起彼伏,每一次大争论之后,我们就等着下一次大争论。这次评分风波也是是争论中的一波而已。
针对具体的社会事件,每个人有每个人的看法,针对电影评分,每个群体也有每个群体的看法,仍然说某部电影有三万人参加评论吧,这三万人若依一定的标准来划分的话,可能至少要分成几十个群体,若再按另一个标准来划分,则又是至少几十个群体,这样多维空间里数不胜数的群体之间,对某部电影如果有完全一致的看法,那简直是不能想像的事情,怎么会有这种事情呢(或者只能发生在我们的东北邻居那个国家吧)。所以当电影评价不一致的时候,我们不应该感到愤怒,而是应该感到欣慰,这至少说明我们不是活在那样一个国度里,而且我们更敢于或者愿意表达自己的真实看法,这难道不是表现社会进步的好事吗?
不过,当前的过于简单的均值汇总评分法,确实无法表达出多元化群体的意见来看,你想这么我多元化群体的意见,最后被用一个数字比如4.8表现出来,这个数字是多么的苍白和无力,然而这好像也不是像豆瓣和猫眼这样的平台应承担的责任吧。社会应该有多种多样的意见表达渠道,用来收集舆情民意,甚至是用来让民众发泄情绪、表达意见,这是更重要的事情,但这是另一个问题在此不叙。
八、评分风波过后,应建立科学客观多元的评价体系
在此次评分风波中,有些人过于看重电影评分,认为电影评分很重要,其原因在于除了评分,你还有什么评价体系吗?当然,我们还有票房,那么除了票房呢?好像再没有了吧。
在一个多元化的社会里,评价体系也应该是多元的,这不仅仅是对于电影而言。电视收视率屡受诟病,也是因为除此之外再无其他衡量指标,那自然就会出现有些人骂收视率是万恶之源,同时还有些人挺而走险想尽办法污染样本户以期改变收视率。
对于分属不同群体的受众而言,我誓死不同意你的观点,所以你的评分是你的评分,我们自有我们的评分,评分可以各不相同,但大家都有各自认可的评分体系,我认可我的评分,但我并不捂你的嘴不让你说,大家各自说话,这是建议多元化评价体系的第一步。(其实批评文章在指责豆瓣的猫眼的时候,也在用艾漫的数据报告做证据,而艾漫用文本挖掘的方式也是另一种不用维度的评价体系。)
对于电影而言,除了票房、评分之后,应该有更多的评价维度和方式,单就评分而言,也应该每个群体都有条件可以提出自己的评分方式,但是每个评分的结果分值之后,一定要有个备注说明这个评分群体的属性特征,也就是把每个原始分和背后的人的属性对应起来,这样我们不仅能看到评分,还得看到背后的人群,这是第二步。
应该有各方都能接受的第三方机构出面(最好是研究机构而非官方机构),把各种评价分值进行综合平衡,做出综合的指标来,这个指标有总指标,它综合各家之长,但更是一个动态的指标,更是一个可以被分解的指标,我可以看到最后的结果,我也可以往前追溯把这个指标给分解开来成为更多往前一个层次的指标,这样我们就能更清楚地理解数据背后的真正含义。
做老师习惯了,所以最后再总结一句话留着大家自己想:科学客观的多元化的评价体系,不仅仅是电影领域需要!所以本文所谈论的,也不仅仅只是统计。那句话是怎么说来着,一认真你不就输了嘛!人民日报客户端再戴帽子,那也不就是一篇文章嘛,这不号称人民日报评论部不是马上发出了不同的声音嘛!
分享到微信朋友圈
在手机阅读、分享本文
还可以输入250个字
推荐文章RECOMMEND
阅读:16万
阅读:1917
阅读:1543
阅读:1363
热门文章HOT NEWS
小米6解决不了小米的问题
maomaobear
百度新闻客户端
百度新闻客户端
百度新闻客户端
扫描二维码下载
订阅 "百家" 频道
观看更多百家精彩新闻

我要回帖

更多关于 豆瓣评分是怎么评的 的文章

 

随机推荐