首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python 分析电影《南方车站的聚会》

《南方车站的聚会》由刁亦男执导,主要演员包括:胡歌、桂纶镁、廖凡、万茜等,该片于 2019 年 5 月 18 在戛纳电影节首映,2019 年 12 月 6 日在中国正式上映。...我们可以看到有 5 万多条影评,目前豆瓣对查看影评数据的限制是:未登录最多可以查看 200 条数据,登录用户最多可以查看 500 条数据,我们要做的是通过 Python 爬取豆瓣 500 条影评数据,然后进行数据分析...'人物', '没有', '不是', '一种', '个人' '如果', '之后', '出来', '开始', '就是', '电影...上面我们只使用了评论内容信息,还有时间和星级信息没有使用,最后我们可以用这两项数据分析下随着时间的变化影片星级的波动情况,以月为单位统计影片从首映(2019 年 5 月)到当前时间(2019 年 12月

63030

商业分析python实战(二):电影智能推荐

这时,可以利用相关数据,研究用户兴趣偏好,分析用户的需求和行为,引导用户发现需求信息,将内容准确推荐给用户。 本例通过943名用户对1664部电影的评分数据,构建协同过滤模型,进而推荐电影供用户观看。...步骤 1、获取数据; 2、数据探索分析; 3、构建智能推荐模型; 4、评估推荐系统模型。...NO.1 获取数据 数据包含943名用户对1664部电影的打分,评分在1-5分之间,超出规定范围的算异常值。...NO.2 数据探索分析 导入的数据共有99416行,3列,第一列为用户id,第二列为电影名字,第三列为打分。...同时,为了进行每部电影的打分数据探索分析,将movie列中的电影名转换为列名,转换后,可观察每部电影的评分用户数及分数的基本分布。

23340
您找到你想要的搜索结果了吗?
是的
没有找到

Python分析《羞羞的铁拳》电影观众评论

專 欄 ❈ 伟楠,Python中文社区专栏作者,数据分析师,知乎专栏:数据故事会。...《夏洛特烦恼》和《驴得水》,留待后面做情感分析时的训练样本。...(这里不得不吐槽下,好像最新的Python (3.6.1)下在用Pandas读取csv文件的时候,如果直接用 pd.read_csv() 的话会报错,必须要做如上处理才行(与中文路径无关,我测试过了),...我本来是想看看一部电影的热度大概能持续多久,不过由于《羞羞的铁拳》是一部上映没多久的电影,所以用它来分析不太合适。...了解数据的情况对于下一步情感分析会起到一定的帮助,比如我们从目前得到信息可以发现,大家对这部电影的评分还是比较高的,情感普遍倾向于正面。

1.1K70

Python数据可视化:2018年电影分析

本次利用猫眼电影,实现对2018年的电影大数据进行分析。 ? / 01 / 网页分析 01 标签 ? 通过点击猫眼电影已经归类好的标签,得到网址信息。 02 索引页 ?...打开开发人员工具,获取索引页里电影的链接以及评分信息。 索引页一共有30多页,但是有电影评分的只有10页。 本次只对有电影评分的数据进行获取。 03 详情页 ? 对详情页的信息进行获取。...04 每月电影上映数量 ? 每月上映数好像没什么大差距,7月最少,难道是因为天气热? 05 每月电影票房 ? 这里就看出春节档电影的威力了,金三银四、金九银十,各行各业的规律,电影行业也不例外。...08 电影名利双收TOP10 ? 计算公式是,把某部电影的评分在所有电影评分中的排名与这部电影的票房在所有票房中的排名加起来,再除以电影总数。...09 电影叫座不叫好TOP10 ? 计算公式是,把某部电影的票房排名减去某部电影的评分排名加起来,再除以电影总数。 可能是猫眼的用户比较仁慈吧,与豆瓣相比,普遍评分都比较高。

90330

Python数据分析之猫眼电影TOP100

前言 如果大家经常阅读Python爬虫相关的公众号,都会是以爬虫+数据分析的形式展现的,这样很有趣,图表也很不错,今天了,我就来分享上一次在培训中的一个作品:猫眼电影爬虫及分析。...爬虫 爬虫分析 这里是获取的是top100的电影数据,进行了跨页爬虫,获取的字段:电影名,主演,上映时间,评分,电影类型和时长。最后保存在csv文件中。...数据分析 数据分析我做成了PPT的样子,大家可以看看~ 总体情况 100部电影,平均得分9.0,平均电影时长128.63。 ? 电影年份趋势 电影年份趋势不大,规律不太明显。 ?...电影月份 大家看电影都知道,电影基本在假期上映更有热度,这里统计出来,发现下半年的电影比上半年电影好很多~ ? 地区 中国和美国还是占了很多的,韩国和日本电影也很不错~ ?...电影类型 电影大部分都是剧情的,爱情才是真谛啊。 ? 演员 小哥和星爷承载了我们的清楚呀~ ? 总结 别看这小小的100条数据,是不是也可以玩出不一样的花样来。

1.1K41

Python分析国庆最火的电影,20万数据分析

今年的国庆假期,电影院里最受大家瞩目的电影想必就是《我和我的祖国》了吧,这部电影无论从题材还是参演阵容来说,都非常值得大家去观看,这部电影的评价也非常的好,因此,小编决定来分析一波,看看大家对于这部电影的评价如何...得到数据后,接下来便是对于数据的分析,首先我们来看一下大家最为关心的,评分的分布情况,如下图所示。 ? 可以看出,大家对于这部电影的评分几乎全都是在5分,满分的评价。而且评分在3分以下的非常少。...接下来我们对于好评和差评的人数已经评分的男女性别进行以下分析。 如下图所示。 ? ? 上图中,由于猫眼上针对于某些用户,没有给出好评和差评的数据,所以我们爬取的数据当中只是包含了绝大部分的观影人群。...由图可以看出,差评的观影者只是针对于电影本身,或者是对于影院的一些服务不满而给出的差评,但是他们对于祖国,还是充满着浓浓的爱意。...---- 以上就是小编为大家带来的《我和我的祖国》分析,通过分析,我们发现,大家对于这部剧是抱着非常高的爱国情怀去观看的,虽然演员有小鲜肉也有老戏骨,但是在国家面前,其他的都是微不足道的。

57600

豆瓣电影数据分析

概述之前(可以无视) 这篇报告是我转行数据分析后的第一篇报告,当时学完了Python,SQL,BI以为再做几个项目就能找工作了,事实上……分析思维、业务,这两者远比工具重要的多。...一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于: a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢?...; 3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错; 概述 本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据...基本框架 1.电影数据的评分、时长分析 1.1 电影数据总体描述 1.2 时长分布 1.3 评分分布 1.4 评分与时长、评论人数的关系 2.电影数据的地区分析 2.1...电影票房分析 结合电影票房网(http://58921.com/)采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量

3.2K30

python分析电影观看数据

但是期待归期待,是否真的值得去电影院观看还是值得商榷的。本片导演 特拉维斯·奈特 主演:海莉·斯坦菲尔德,约翰·塞纳,小豪尔赫·兰登伯格 目前在猫眼电影中评分:9.20,评价人数:129402人。...猫眼电影目前m端有些数据还是直接返回json数据,所以抓取还是很方便。之前看网络上有一个分析海王电影的文章,但是一直没有找到代码,所以自己写了一个。...不仅仅支持一个电影,可以对猫眼电影里的所有电影进行分析,前提是能爬下来数据。实验过程中,都是爬取10个电影就无法拿到数据了。...猫眼电影电影列表数据url:http://m.maoyan.com/ajax/movieOnInfoList?token=没有任何参数,接口会返回当前猫眼可见的电影id列表,后面爬取电影详情需要。...基本上电影数据都在这里面,但是很遗憾,没有票房数据。 评论详情,用的是旧的url http://m.maoyan.com/mmdb/comments/movie/%d.json?

47520

多模型电影短评情感分析

多模型电影短评情感分析 首先,从传统的特征提取方面对比了BOW、TF-IDF、N-Gram技术,并使用不同的机器学习算法构建了不同的子模型,然后又采用了Stacking模型融合技术对短评情感进行了进一步的探索...言归正传,下面一起来看看电影短评情感分析的结果吧!...者将从以下几个大方向构建电影短评情感分析模型: 基于Bag-Of-Words特征的文本分类模型 基于TF-IDF特征的文本分类模型 基于Stacking模型融合的情感分析 基于深度学习的短评情感分析 基于...数据集说明 data目录里面的数据,只有2万行, 本项目为电影短评情感分析项目,代码文件说明: code/preprocessing.py]: 预处理文件 code/stacking.py: stacking...code/dl_sa.py: 基于深度学习的情感分析模型。

44120

移动电影售票系统案例分析

议题与其他 UC002:查询电影票 用例名: 查询电影票 用例编号 UC002 参与者 潜在会员,会员 用例描述 参与者根据电影的名称、导演、以及演员,检索出所需电影的详细信息和...系统按查询条件查询电影信息和价格信息 4. 系统显示查询到电影详细信息 5. 参与者选中某个电影 6. 系统显示该电影的详细信息 替代流程 3a....商户请求发布电影信息 2. 系统显示发布电影信息界面 3. 商户输入电影信息 4. 系统检查输入的电影信息 5....系统顺序图:引导从用例过渡到系统的功能 BCE模式顺序图: 鲁棒性分析方法( 边界对象 控制对象 实体对象 ) UC001:注册会员 ? UC002:查询手机 ?...面向对象 什么是面向对象的分析? 面向对象的分析(Object Oriented Analysis,OOA)强调的是在问题域内发现和描述对象(或概念)。

2.1K50

TMDB电影数据分析报告

TMDB电影数据分析报告 前言 数据分析的基本流程: 提出问题 理解数据 数据清洗 构建模型 数据可视化 形成报告 一、提出问题 本次报告的主要任务是:根据历史电影数据,分析哪种电影收益能力更好...导入数据集后,通过对数据的查看,并结合要分析的问题,筛选出以下9个要重点分析的变量: |序号|变量名|说明 |------ |1|budget|电影预算(单位:美元) |2|genres|电影风格 |3...特征选择:在分析每一个小问题之前,都要通过特征提取,选择最适合分析的变量,即在分析每一个小问题时,都要先构造一个数据框,放入要分析的变量,而不是在原数据框中乱涂乱画。...', fontsize=20) plt.show() 不同电影风格的受欢迎程度分析: #定义一个数据框,以电影类型为索引,以每种电影类型的受欢迎程度为值 df_gen_popu = pd.DataFrame...= 15) plt.xticks(np.arange(11)) plt.grid(True) plt.show() 原创电影与改编电影对比分析: #原创电影与改编电影对比分析 original_novel

93250

Python实现电影订票系统

一、效果展示 通过Python实现一个电影订票系统,效果如下所示: http://mpvideo.qpic.cn/0bc3niabuaaab4akb5jce5rfa2wddjvaagqa.f10002...二、整体结构图 三、代码分解 3.1 infos.py 一部电影的详细信息适合用 字典 结构来存储,我们可以给字典里添加多个键值对来保存电影的名称、座位表和宣传时用的字符画,比如电影《泰坦尼克号...为此,我们需要完成下面两样需求: 和选座系统一样,我们可以把“选择电影场次”功能抽象成一个类,称为 电影选择系统。...而根据用户选择,预订某一场次的座位,实际上是先调用 电影选择系统 选择电影,再调用 选座系统 预订座位。...= film['seats'] symbol = film['symbol'] # 打印提示信息和电影宣传画 print('正在为您预订电影《{}》的座位...'.format

83620

Python】爬虫+ K-means 聚类分析电影海报主色调

每部电影都有自己的海报,即便是在如今这互联网时代,电影海报仍是一个强大的广告形式。每部电影都会根据自身的主题风格设计海报,精致的电影海报可以吸引人们的注意力。...那么问题来了,不同风格的电影海报对颜色有什么样的偏好呢? 1、利用Python爬取海报数据 为了回答这个问题,我们需要分析不同风格电影的海报情况。...接下来我利用 Python 从网页中抓取电影海报数据并将其储存到本地电脑中,最终我得到四种电影类型(惊悚片、喜剧、动画片和动作片)的112张海报数据。 ? 其中部分海报数据如下图所示: ?...我们可以将颜色信息转换到 Lab 色彩空间中,然后利用Python中的 Delta E equations和colormath包来计算海报中的颜色和基础颜色之间的视觉差异程度。...原文链接:http://blog.nycdatascience.com/students-work/using-python-and-k-means-to-find-the-colors-in-movie-posters

1.1K50

Python】爬虫+ K-means 聚类分析电影海报主色

作者:Amy 译者:Fibears 原文链接:http://blog.nycdatascience.com/students-work/using-python-and-k-means-to-find-the-colors-in-movie-posters...每部电影都会根据自身的主题风格设计海报,精致的电影海报可以吸引人们的注意力。那么问题来了,不同风格的电影海报对颜色有什么样的偏好呢?...利用Python爬取海报数据 为了回答这个问题,我们需要分析不同风格电影的海报情况。首先,我们需要构建一个电影海报数据的数据集,因此我利用 Bing 图像搜索引擎来获取海报数据。 ?...接下来我利用 Python 从网页中抓取电影海报数据并将其储存到本地电脑中,最终我得到四种电影类型(惊悚片、喜剧、动画片和动作片)的112张海报数据。...我们可以将颜色信息转换到 Lab 色彩空间中,然后利用Python中的 Delta E equations和colormath包来计算海报中的颜色和基础颜色之间的视觉差异程度。

1.2K50
领券