豆瓣排名前50电影(国产好看电影介绍几部)

2022-06-15 15:45:11 发布:网友投稿
热度:848

豆瓣电影50强(部分国产好看电影介绍)

1报价

中国电影产业发展迅速,线上大数据对电影的影响也越来越大。豆瓣平台是一种更方便快捷的传播方式,更贴近现代生活节奏,逐渐成为电影批评文化的主流。豆瓣电影提供最新的电影介绍和评论,包括已上映电影的视频信息查询和购票服务。可以把自己想看的电影电视剧录下来,边看边看,顺便评分写影评,大大方便了人们的生活。豆瓣电影这样自我介绍:“国内最权威的电影评分和精彩的影评,百万粉丝的真实观影体验,为你的观影做决定。”它确实做到了。然而,前几天,朋友圈又沸腾了。12月27日,《中国电影报》发表了一篇题为《豆瓣电影评级面临信用危机》的文章,随后人民日报客户端转发了这篇文章,并将标题改为《豆瓣电影评级和猫眼电影面临信用危机,差评伤害电影行业》。在这个互联网将渗透到整个电影产业链的时代,网络数据对电影的影响越来越大。2010年国产电影票房首次突破百亿,中国电影进入百亿时代。2015年,中国电影票房突破440亿元,电影市场的大踏步前进吸引了全世界的目光。国产电影中,好评如潮、票房高的电影很多,但面对巨大的市场,中国电影的发展方向仍不明朗,部分电影的好评率与票房关系并不成正比。在这种情况下,分析国产电影的数据,指出其发展方向就显得尤为重要。

2个数据源

数据来自豆瓣电影TOP250。我们通过python对网站数据进行抓取,共获得了250条关于豆瓣电影的电影信息,包括收视率、收视率、导演、编剧、主演角色、类型、制作国家/地区、语言、上映日期、片长、剧情简介、热门影评以及豆瓣成员的热门标签。同时,我们抓取前三部电影的热评进行文本分析。

3豆瓣电影数据

主要分析Python收购的豆瓣电影TOP 250(https://movie . Douban . com/TOP 250)的相关电影。技术分析过程分为以下三个步骤:网络数据采集、数据读取和数据清洗、数据可视化分析。通过网站爬虫,我们整理出了7个字段,分别是评分、评分数、导演、编剧、主演角色、类型、制作国家/地区、语言、上映日期、片长、故事梗概、热门影评、豆瓣成员常用标签。

3.1发布年份分析

图1豆瓣电影TOP250各时代电影数量

好评电影多集中在90后。在1990年之前和1990年之后,受欢迎的电影数量几乎没有波动。电影会随着时代的变化而变化,如今的观影者对现代电影艺术的接受度会更高,在豆瓣Top250中,时间跨度为1931年到2017年,其中大部分电影集中在1990年以后,入围电影数量最多的年份为1994年、2004年和2010年,占比14.4%。1994年被称为电影年,那一年诞生了很多优秀的电影,比如《肖申克的救赎》这部常年在豆瓣收视率最高的电影,当年奥斯卡获奖影片《阿甘正传》和同样在1994年上映的《黑仔不太冷》。不仅仅是外国电影,1994年也是国产电影的巅峰时期,5部中国电影入围豆瓣Top250。《红玫瑰与白玫瑰》、《饮食男女与重庆森林》也于1994年上映。进入21世纪后,出现了大量好评如潮的电影。最受欢迎的电影出现在2000年到2009年之间。

3.2生产国/地区分布分析

图2豆瓣电影全国20强电影数量

高口碑电影的生产国以美国为首,占比接近50%。从图中可以看出,上榜的美国大片较多,其次是日本、英国和中国。榜单上的中外电影还是有差距的。美国电影产业相对成熟,引领着这个时代的电影艺术潮流。

图3豆瓣电影前20名国片数量

中国的电影长度普遍比国外短。国外片长100-150分,平均125分,国内100-120分,平均110分。国外的分数普遍高于国内,但集中度差不多。

3.3导演/主演分析

图4豆瓣电影十大导演电影数量

在广受好评的电影中,有多位导演的不止一部电影上榜,其中上榜电影数量最多的两位导演是克里斯托弗·诺兰和宫崎骏其人。后来有很多中国导演。导演对一部电影有很大的影响。可以说,一个好的导演可以决定一部电影的成功与否。电影的主题、创作风格和视听语言,以及导演的地位和价值,也可以在相应电影中演员的表演和后期制作中看到。

图5豆瓣电影十大主演电影数量

演员在电影创作过程中扮演着另一个重要的角色,导演认可的演员在电影中扮演着角色。张国荣、梁朝伟、周星驰等香港演员出演了不少上榜电影,其他基本都是外国影星,这说明国内影星还是有待提高的,演员在电影中的表现也是决定电影受欢迎与否的重要因素,明星带来的“粉丝效应”也不容忽视。电影获得了高票房或高分,演员扮演了重要角色。

3.4胶片类型分布分析

图6豆瓣电影前20名国片数量图7标签分布

在广受好评的电影中,故事类型电影一炮而红,有多达186部电影贴上了“故事”的标签。从那以后,出现了许多爱情、喜剧和冒险的电影。电影类型决定了电影的基调和主题,是决定电影内容的重要因素之一。随着电影行业的不断发展,电影的类型也越来越多样化。2010年后,中国电影市场主要由三种类型组成:爱情片、喜剧片和动作片。不过警匪片、谍战片、歌舞片、传记片的市场反响也很不错。电影市场形成了以武侠、动作、爱情、喜剧、剧情为主要类型,警匪、战争、历史为媒介梯度,魔术、传记、歌舞为新兴品种的稳定结构。在众多高分电影中,喜剧电影占19%,犯罪电影和悬疑电影分别占17%和15%。与喜剧电影一起,是占比最高的前三类电影。观众对喜剧电影、犯罪电影和悬疑电影的关注程度比其他类型的电影要高一点。观众爱看戏剧、喜剧、言情片,而这些恰恰都有高分,这说明在未来国产电影的发展中,在电影产业新格局的影响下,电影的类型会越来越多,传统喜剧、言情片等类型电影也会携手悬疑、犯罪等新类型来到银幕。一部电影的类型很难用一两种类型来概括。将会有越来越多的多流派电影同时出现,其结构和手法也会更加成熟。单一电影类型的多元化将成为电影类型发展的必然趋势。

3.5评分/评分数分析

图8分数分布

根据图8,我们可以看到收集到的电影数据得分主要集中在8.0-10.0之间,呈现出向两极逐步递减的趋势。在这里,区间按照得分来划分:信誉差8.25-8.55,信誉差8.55-8.85,信誉尚可8.85-9.15,信誉好9.15-9.45,信誉好9.45-9.45。

图9评分标准

通过将评分数据细化到每年进行观察,可以发现30年的电影数量与电影年平均评分成反比,年平均评分整体呈下降趋势。2016年电影平均分最低,电影数量最多。再者,我们可以找出每年不同收视率的电影数据的比例。近年来,评分为[2.0,6.0]的电影数据比例明显上升,评分为[6.0,7.0]的比例不变,评分为[7.0,10.0]的数据比例下降。可能的原因如下:1。幸存者偏差,1990年至2000年的不良作品很少受到关注,数据保存困难。豆瓣数据库只收录了比较优质的作品。2.近年来,低质量的影视作品越来越多,降低了平均得分。

图10豆瓣电影排名及评分数

分数越高,排名越高。图中颜色越深,得分越低。我们发现排名垫底的评分者数量少,评分低。评分者人数越多,评分越高。豆瓣电影是中国最大的电影分享和评论社区,聚集了数千万电影爱好者,2012年每月覆盖超过1亿用户。观众可以在这个平台上给电影打分,并对电影进行相关评论。如今,豆瓣评分已经成为衡量一部电影是否“可看”的重要因素。无论是网上购票还是在网络平台上搜索电影,评分结果都会显示在显眼的位置,很多观众会根据评分结果选择是点击学习还是观看这部电影,点击率与评分结果成正比。

4豆瓣文字资料

本文将豆瓣文字资料分为两类,一类是剧情简介、影片类型(标签)和另一类是热门影评。每部电影都会有这样的文本数据。当我们拿到电影介绍的网站,比如《肖申克的救赎》(https://movie . douban . com/subject/1292052/)时,梗概如下;

图11

对应源代码:一起谋杀案让银行家安迪(TimRobbins)被不公正地监禁,而谋杀妻子和情人的指控会让他终身监禁。他第一次出现在肖申克监狱让监狱里的“老大哥”瑞德(摩根·弗里曼饰)对他有了不同的看法。瑞德帮他拿到了石锤和一张女明星的海报,他们成了患难之交。很快,安迪在监狱中展现了自己的才华,担任了监狱图书管理员,并利用自己的金融知识帮助监狱官员避税,这引起了监狱长的注意,并导致他帮助监狱长洗钱。偶尔,他得知一个刚入狱的小偷可以作证,帮助他洗脱罪名。抱着一线希望的安迪找到了典狱长,希望他能帮自己扭转局面。阴险虚伪的典狱长假装答应安迪,却在背后派人杀贼,让他合法出狱的唯一希望化为泡影。沮丧的安迪没有绝望。在一个电闪雷鸣的暴风雨之夜,一个隐藏了几十年的逃跑计划让他救赎了自己,重获了自由!老朋友瑞德,在他的鼓励和帮助下,也勇敢地奔向自由。

这部电影在1995年获得了10项奥斯卡提名,以及金球奖、土星奖等多项提名。

热门电影评论在标签链接报告中,如下所示:

图12

当我们使用for循环使用requests+bs4来抓取上述信息时。

图13

4.1热门影评的探索与分析

表1

等级

电影

主管

类型

国家

标签

一个

肖申克的救赎

弗兰克·达拉邦特

阴谋,犯罪

美利坚合众国

经典,灵感,信仰,自由,人性,生活,美国,希望

2

霸王别姬

陈凯歌

情节,爱情,同性恋

中国

经典,人性,文艺,爱情,生活,文革,剧情,同志。

《阿甘正传》

罗伯特·泽米基斯

剧情,爱情

美利坚合众国

励志,经典,生活,成长,美国,信仰,情节,人性

1)《肖申克的救赎》

图14

影片主要讲述了银行家安迪被错杀妻子和情人,并被囚禁的故事。一个小偷因盗窃入狱,知道了安迪妻子和情人死亡的真相,典狱长拒绝帮他翻案。知道真相后,安迪决定通过自己的救赎获得自由,最终成功越狱。影片以“希望”为主题,通过监狱这个强制剥夺自由、高度强调纪律的特殊背景,展现了个体对“时间流逝和环境改造”的恐惧。电影的结局有《基督山伯爵》的复仇宣泄。《肖申克的救赎》是一部不可多得的优秀励志电影。个人认为,我之所以保留它作为一部电影,是因为它的主题深远。它给了人们一种无形的力量,它让我知道了人一生中应该拥有的最珍贵的东西。这样才能珍惜你还有的机会。

2)《霸王别姬》

图15

主演:张国荣(霸王,人称‘哥哥’)、程蝶衣(虞姬),导演:陈凯歌。这是一部震撼和感动观众的经典中国历史电影。讲述了霸王项羽和虞姬的爱情故事。

3)《阿甘正传》

图16

阿甘和珍妮是青梅竹马,阿甘喜欢珍妮。两个人成年后走不同的路。阿甘天生智商低,专门从事诚实坦率的工作,毕业后去服兵役。珍妮叛逆又爱冒险,四处游荡。在经历了人生的种种磨难之后,阿甘保持了自己的本心,始终深爱着珍妮,愚者有愚者有福报,事业一直在上坡。珍妮迷失在生活中,迷失了方向,想过自杀。阿甘从未放弃珍妮。珍妮终于想通了,放弃了散漫的生活,回到了阿甘身边。

4.2常见标签分析

图17

下表显示了PMI最高的前15个标签:

表2

一个

默片

卓别林

6.965784285

2

清新

敏感

6.965784285

情绪

旅行

6.965784285

英雄

诺兰

5.965784285

记忆

中国制造

5.965784285

人种

非洲

5.965784285

自然

新鲜/美味的食物

5.965784285

大块

新西兰

5.795859283

张国荣

梁朝伟

5.64385619

10

生活

新鲜/美味的食物

5.64385619

11

信仰;相信

钢琴

5.380821784

12

“文化大革命”(1966-1976)

姜文

5.380821784

13

灾难

大块

5.380821784

14

温暖

环境保护

5.380821784

15

理由

法律

5.380821784

在本节中,我们将使用KMeans进行聚类。k- medoids聚类不以类对象的平均值为中心点。中心对象是数据集中的实际对象,而k均值聚类中的类中心对象是通过计算类中每个对象的均值得到的虚拟对象。它对中小数据集有效,但不适用于大数据集的聚类。构建词袋模型后,生成文档词矩阵cv_fit并进行聚类。然后绘制聚类结果的散点图,如下图所示。

图18

4.3分类模型和预测电影类别

K-近邻分类算法(kNN)是一种“近邻决定类别”的分类算法,属于示例匹配算法。本节我们将使用分类或监督机器学习方法(Knn算法)对文档进行分类,预测《小红花》的类别,并预测其属于剧情,准确率为0.7572,召回率为100%。

流程:

1.规范训练数据(揭巴分词)。

2.使用CountVectorizer类构建词袋模型,从数据中提取特征或属性(豆瓣Top250故事板)。对于每个数据点,我们将有特征集(故事板的文档字矩阵DTM)和相应的类型(逻辑值(1,0)电影是否属于“故事板”)。

3.该算法从训练数据中学习每个分类的不同模式。学习后,我们得到一个训练有素的模型KNN。

学习步骤:计算距离:给定测试对象,计算它与训练集中每个对象的距离。寻找邻居:圈出最近的k个训练对象作为测试对象的最近邻居。决策类别:根据K个邻居所属的主要类别对测试对象进行分类。简单投票法:少数服从多数,邻域内那个类别的点最多归入这个类别。

3.未来,测试数据样本的特征(一朵小红花的剧情梗概)将被送入模型KNN,模型可以预测它是否属于“剧情”。

4.制作混淆矩阵,评价分类模型。过程:训练,从训练集中统计两种概率:每种标记的文档数量和每种中每个词项出现的频率。分类:计算类标签的先验概率和条件概率。

概念公式:

召回率=系统检索到的相关文件/系统所有相关文件的总数。

准确性=系统检索到的相关文件/系统检索到的文件总数。

F1=2PR/(P+R)

KNN算法预测的混淆矩阵如下所示:

图19

准确度=184/(184+59)=75.72%

召回率=184/(184+0)=100%

5结论

本文通过探索豆瓣电影Top250的指标,并对其榜单中的数据进行分析,得出以下结论。

电影艺术是与时俱进的,大多数观影者在这个时候更容易接受类似时代的电影。21世纪前10年的电影是最受好评的时期。电影制作人可以选择翻拍10年前到20年前的电影,以口碑吸引观众。观众也可以选择在休息期间看电影。电影会随着时代的变化而变化,今天的观众会更容易接受现代电影艺术。导演是一部电影质量的关键因素之一,一个好的导演才能拍出一部电影。在选择导演时,电影制片人可以选择名单上有很多作品的导演。观众可以选择观看克里斯托弗·诺兰和宫崎骏其人导演的电影。导演对一部电影有很大的影响。可以说,一个好的导演可以决定一部电影的成功与否。3.好的电影一般来自于好的电影氛围,制作国家可以影响电影。在受欢迎的电影中,美国电影占了近一半。电影制作人可能会借鉴美国电影的流行趋势,观众可能会选择美国电影观看。电影的主题、创作风格和视听语言,以及导演的地位和价值,也可以在相应电影中演员的表演和后期制作中看到。4.电影类型是观众选择是否看这部电影的重要因素之一。“剧”“爱”“喜剧”是观众的主流,可以看作是电影制作方口碑的保守选择,观众可以选择这些类型观看。一部电影的类型很难用一两种类型来概括。将会有越来越多的多流派电影同时出现,其结构和手法也会更加成熟。单一电影类型的多元化将成为电影类型发展的必然趋势。

下一篇:女人梦见老鼠什么征兆(梦见看见耗子在跑意味着什么)
上一篇:电信怎么查流量(手机怎么查流量)