首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

当我在pycharm中运行‘’sns.histplot(df[‘price’])‘’时,我得到了代码输出,但没有图形,为什么会这样?

当在pycharm中运行'sns.histplot(df['price'])'时,没有图形输出的原因可能是缺少可视化库或者缺少必要的配置。

首先,确保已经安装了必要的可视化库,例如seaborn和matplotlib。可以使用以下命令安装这些库:

代码语言:txt
复制
pip install seaborn matplotlib

如果已经安装了这些库,那么可能是由于缺少必要的配置导致没有图形输出。可以尝试在代码中添加以下语句来配置图形输出:

代码语言:txt
复制
import matplotlib.pyplot as plt
plt.show()

这将显示图形窗口并输出图形。

另外,还需要确保在pycharm中的配置正确。可以检查以下几点:

  1. 确保已经选择了正确的Python解释器。可以在pycharm的设置中检查并选择正确的解释器。
  2. 确保代码所在的文件是打开的。如果代码文件没有打开,图形可能无法正确显示。
  3. 检查pycharm的运行配置。在运行代码之前,可以在pycharm的运行配置中添加必要的参数或环境变量。

如果以上步骤都没有解决问题,可以尝试在pycharm之外的环境中运行相同的代码,例如在Jupyter Notebook或者命令行中运行,以确定问题是否与pycharm相关。

关于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体品牌商,无法给出具体链接。但腾讯云提供了丰富的云计算服务,包括云服务器、云数据库、云存储等,可以根据具体需求选择适合的产品。可以在腾讯云官网上查找相关产品和文档。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

贝叶斯自举法Bayesian Bootstrap

当观察结果彼此紧密联系,比如在研究社交网络或市场互动,可能违反此假设。 bootstrap仅仅是加权吗?...当我们重新抽样,我们所做的其实就是给我们的观察值分配整数权重,这样它们的和就等于样本容量n。这样的分布就是多项式分布。 我们绘制大小为10.000的样本来看看多项式分布是什么样子的。...为什么?如果我们更仔细地查看就会发现在将近20个重新采样的样本,会得到一个非常不寻常的估计! 这个问题的原因是某些样本,我们可能没有任何观察结果x = 1。...并且这里的一个重要的问题是我们没有收到任何错误消息或警告,这样我们很容易忽视这个问题!...总结 本文中我们介绍了贝叶斯自举法, 它的关键的想法是,每当我们的估计量以加权估计量表示,自举过程就等于用多项式权重随机加权。贝叶斯自举等同于用狄利克雷权重加权,这是多项式分布的连续等效物。

54620

贝叶斯自举法Bayesian Bootstrap

当观察结果彼此紧密联系,比如在研究社交网络或市场互动,可能违反此假设。 bootstrap仅仅是加权吗?...当我们重新抽样,我们所做的其实就是给我们的观察值分配整数权重,这样它们的和就等于样本容量n。这样的分布就是多项式分布。 我们绘制大小为10.000的样本来看看多项式分布是什么样子的。...为什么?如果我们更仔细地查看就会发现在将近20个重新采样的样本,会得到一个非常不寻常的估计! 这个问题的原因是某些样本,我们可能没有任何观察结果x = 1。...并且这里的一个重要的问题是我们没有收到任何错误消息或警告,这样我们很容易忽视这个问题!...总结 本文中我们介绍了贝叶斯自举法, 它的关键的想法是,每当我们的估计量以加权估计量表示,自举过程就等于用多项式权重随机加权。贝叶斯自举等同于用狄利克雷权重加权,这是多项式分布的连续等效物。

63910

使用可视化工具和统计方法检测异常值

与缺失值类似,异常值破坏数据科学项目并返回错误的结果或预测。异常值也可能出现在倾斜数据,这些类型的异常值被认为是自然异常值。 异常值影响数据的平均值、标准差和四分位范围。...如果我们去除异常值之前和之后计算这些统计数据,我们会得到不同的结果。 异常值如何影响机器学习模型?...如果我们的数据集很大,异常值很少,我们应该保留这些异常值,因为它们不会显著影响结果,并且可以为我们的模型带来泛化的效果。 如果我们非常确定异常值是由于测量误差带来的,则应该从数据集中删除它们。...sns.histplot(df, x="age", kde=True) sns.histplot(df, x="bmi", kde=True) sns.histplot(df, x="expenses...通过分析这两种图形表示,我们可以决定要排除那些数据。对于年龄不排除任何值。对于bmi我们将排除高于47的值,对于费用,我们将排除高于50000的值。

33410

睡眠健康数据分析

在这里,当我们查看分类变量,我们可以看到我们的数据男性和女性之间分布良好,查看身体质量指数,我们可以看到大多数人在正常和超重之间,当我们查看我们的目标变量,我们可以看到大多数人没有睡眠问题,那些有睡眠问题的人在失眠和睡眠呼吸暂停之间分布良好...当我们看我们的分类变量,我们可以看到,我们大多数变量没有一个模式,几乎所有的变量一些数据显示平衡,而在另一些数据不显示平衡。...我们设法得到了一个更好的结果,逻辑回归模型,我们有91.11%的准确率。...当进行数据分析,我们可以看到我们的数据之间有很多相关性,但由于我们几乎没有可用的数据,所以没有删除这些数据,当我们具体查看我们的分类变量,我们可以看到我们的数据性别变量方面很平衡, 当我们查看我们的目标变量...,我们可以看到我们的大部分数据没有睡眠问题,那些有睡眠问题的数据两个类别之间很好地平衡(睡眠呼吸暂停和失眠),当我们查看连续变量,我们没有发现它们之间的模式,查看箱线图发现没有必要处理异常值,

17110

数据科学家易犯的十大编码错误,你中招了吗?

没有共享代码引用的数据 数据科学需要代码和数据。所以为了让其他人能够复现自己做出来的结果,你需要提供代码涉及的数据。这看起来很简单,许多人忘记共享代码需要的数据。...将数据和代码混在一起 既然数据科学代码需要数据,为什么不将代码和数据存储同一个目录呢?运行代码,这个目录还会存储图像、报告以及其他垃圾文件。乱成一团!...共享数据,可能很容易将数据文件添加到版本控制。对一些小文件来说这没什么问题。 git 无法优化数据,尤其是对大型文件而言。...写 for 循环 和函数一样,for 循环也是你在学代码最先学的。这种语句易于理解,运行很慢且过于冗长,这种情况通常表示你不知道用什么替代向量化。...然后你和自己的代码大眼瞪小眼,既不记得你为什么要这么做,也不记得你做过什么。现在想象一下其他人运行这段代码的心情。

53530

数据科学家易犯的十大编码错误,你中招了吗?

没有共享代码引用的数据 数据科学需要代码和数据。所以为了让其他人能够复现自己做出来的结果,你需要提供代码涉及的数据。这看起来很简单,许多人忘记共享代码需要的数据。...将数据和代码混在一起 既然数据科学代码需要数据,为什么不将代码和数据存储同一个目录呢?运行代码,这个目录还会存储图像、报告以及其他垃圾文件。乱成一团!...共享数据,可能很容易将数据文件添加到版本控制。对一些小文件来说这没什么问题。 git 无法优化数据,尤其是对大型文件而言。...写 for 循环 和函数一样,for 循环也是你在学代码最先学的。这种语句易于理解,运行很慢且过于冗长,这种情况通常表示你不知道用什么替代向量化。...然后你和自己的代码大眼瞪小眼,既不记得你为什么要这么做,也不记得你做过什么。现在想象一下其他人运行这段代码的心情。

73620

手把手| 用Python代码建个数据实验室,顺利入坑比特币

at {}'.format(quandl_id, cache_path)) return df 我们用pickle来序列化,把下载的数据存成文件,这样代码就不会在每次运行的时候重新下载同样的数据...2.6 清理并加总价格数据 从以上图形可以看到,尽管这四个系列数据遵循大致相同的路径,其中还是有一些不规则的变化,我们将设法清除这些异常变化。...2012-2017年的时间段,我们知道比特币的价格从来没有等于零的时候,所以我们先去除数据框中所有的零值。...8/22/2017修订说明-这部分的修改是为了计算相关系数使用每日回报率而不是价格的绝对值。 基于一个非稳态时间序列(例如原始的价格数据)直接计算可能导致相关性系数的偏差。...可以将你的分析开源共享,参与到社区,或者写一篇博客! 希望你现在已经掌握了自行分析所需的技能,以及未来读到任何投机性的加密货币的文章,进行辩证思考的能力,尤其是那些没有数据支撑的预测。

1.4K30

如何比较两个或多个分布:从可视化到统计检验的方法总结

当这种情况发生,就不能再确定结果的差异只是由于实验得来的。因此,随机化后,检查所有观察变量是否组间平衡,是否没有系统差异是非常重要的。...累积分布函数的主要优点是 不需要做出任何的选择(例如bin的数量) 不需要执行任何近似(例如使用 KDE),图形代表所有数据点 sns.histplot(x='Income', data=df, hue...所以我们可能在一个差异非常小样本量很大的实验获得显着的结果,而在差异很大样本量小的实验我们可能获得不显着的结果。 解决这个问题的一种解决方案是标准化平均差 (SMD)。...这是为什么? 原因在于这两个分布具有相似的中心尾部不同,并且卡方检验测试了整个分布的相似性,而不仅仅是中心,就像我们之前的检验中所做的那样。...箱线图 当我们有多组,箱线图可以很好地扩展,因为我们可以并排放置不同的框。

1.4K30

使用可视化工具和统计方法检测异常值

与缺失值类似,异常值破坏数据科学项目并返回错误的结果或预测。异常值也可能出现在倾斜数据,这些类型的异常值被认为是自然异常值。 异常值影响数据的平均值、标准差和四分位范围。...如果我们去除异常值之前和之后计算这些统计数据,我们会得到不同的结果。 异常值如何影响机器学习模型?...如果我们的数据集很大,异常值很少,我们应该保留这些异常值,因为它们不会显著影响结果,并且可以为我们的模型带来泛化的效果。 如果我们非常确定的异常值是由于测量误差带来的,则应该从数据集中删除它们。...sns.histplot(df, x="age", kde=True) sns.histplot(df, x="bmi", kde=True) sns.histplot(df, x="expenses"...通过分析这两种图形表示,我们可以决定要排除哪些数据。对于年龄不排除任何值。对于bmi我们将排除高于47的值,对于费用,我们将排除高于50000的值。

71130

如何比较两个或多个分布:从可视化到统计检验的方法总结

当这种情况发生,就不能再确定结果的差异只是由于实验得来的。因此,随机化后,检查所有观察变量是否组间平衡,是否没有系统差异是非常重要的。...累积分布函数的主要优点是 不需要做出任何的选择(例如bin的数量) 不需要执行任何近似(例如使用 KDE),图形代表所有数据点 sns.histplot(x='Income', data=df, hue...所以我们可能在一个差异非常小样本量很大的实验获得显着的结果,而在差异很大样本量小的实验我们可能获得不显着的结果。 解决这个问题的一种解决方案是标准化平均差 (SMD)。...这是为什么? 原因在于这两个分布具有相似的中心尾部不同,并且卡方检验测试了整个分布的相似性,而不仅仅是中心,就像我们之前的检验中所做的那样。...箱线图 当我们有多组,箱线图可以很好地扩展,因为我们可以并排放置不同的框。

1.7K20

【统计学基础】从可视化到统计检验,比较两个或多个变量分布的方法总结

当这种情况发生,就不能再确定结果的差异只是由于实验得来的。因此,随机化后,检查所有观察变量是否组间平衡,是否没有系统差异是非常重要的。...累积分布函数的主要优点是 不需要做出任何的选择(例如bin的数量) 不需要执行任何近似(例如使用 KDE),图形代表所有数据点 sns.histplot(x='Income', data=df, hue...所以我们可能在一个差异非常小样本量很大的实验获得显着的结果,而在差异很大样本量小的实验我们可能获得不显着的结果。 解决这个问题的一种解决方案是标准化平均差 (SMD)。...这是为什么? 原因在于这两个分布具有相似的中心尾部不同,并且卡方检验测试了整个分布的相似性,而不仅仅是中心,就像我们之前的检验中所做的那样。...箱线图 当我们有多组,箱线图可以很好地扩展,因为我们可以并排放置不同的框。

1.8K20

解决jupyter notebook

6 plt.show() jupyter notebook能够成功运行: ?...再次运行pandas的plot()方法, 仍然报错, 而且再次检查没有发现语句中存在错误. 那么问题来了, 为什么pandas的plot()方法不能用? 3....换IDE试试, 看看在pycharm能不能运行: 1 import pandas as pd 2 import matplotlib.pyplot as plt 3 df = pd.read_csv(...pycharm能够成功运行, 而在jupyter notebook不能运行, 看起是IDE的问题, 那么两者存在什么差异呢:  就个人电脑而言, pycharm刚刚启动的(安装好matplotlib...总结 个人猜想: 使用pandas的plot()方法, matplotlip里的pyplot绘图框架仅仅是用来展示图形的, 而要想让两者实现交互, 那应该确保启动IDE之前两者都被成功安装.

1.3K30

最终还是选择了 VS code...

后来,到了 MobaXterm,使用几个月之后很惊叹,为什么有这么强大的工具?...使用 Pycharm ,可以通过快捷键给代码添加上标签,当我们想回到某一个位置能够使用快捷键或者搜索的方式快速定位到准确的位置,这也是 Pycharm 吸引的地方之一,它也养成了喜欢打标签的习惯...刚从 Pycharm 迁移到 vs code 标签这一块很不习惯,发现总是忘记之前所在代码片段。最后发现,vs code 也可以通过配置插件实现强大的标签功能,这款插件就是 Bookmarks。...开发过程中常用的待办标记有 TODO 和 FIXME, Pycharm 当我们使用这两个标记时它能够自动对其进行高亮显示,这样对于我们找到标记处非常方便。...Code Runner 这是一款支持 C、C++、Java、Python 等主流编程语言快速运行的插件,它能够便捷的运行当前活动页代码文件、能够运行选定代码段、运行自定义命令,对于调试代码具有很大的帮助

1.4K20

Python初学者常犯错误及解决方法自查

绝大多数的代码交互环境和通过xxx.py运行,效果是一样的。 已经安装了第三方模块,PyCharm里面依然提示没有安装? 这种情况多发于我们直接从PyCharm创建项目的情况。...那么,PyCharm又闹什么幺蛾子了吗? 实际上这是功能不是bug。当我新版的PyCharm里面创建工程的时候,PyCharm自动为这个工程创建一个虚拟环境,如下图所示。 ?...当时当你使用PyCharm打开一个项目文件夹,由于还没有运行这个项目中的某个文件,所以PyCharm以当前打开的这个项目文件夹为工作区。...在这个例子PyCharm代码练习这个文件夹作为工作区。...所以当我main.py写 from login import login的时候,PyCharm代码练习这个文件夹里面去寻找login.py文件。

99520

Python初学者常犯错误及解决方法自查

感兴趣的朋友可以关注的微信公众号。 绝大多数的代码交互环境和通过xxx.py运行,效果是一样的。 已经安装了第三方模块,PyCharm里面依然提示没有安装?...当我新版的PyCharm里面创建工程的时候,PyCharm自动为这个工程创建一个虚拟环境,如下图所示。...当时当你使用PyCharm打开一个项目文件夹,由于还没有运行这个项目中的某个文件,所以PyCharm以当前打开的这个项目文件夹为工作区。...在这个例子PyCharm代码练习这个文件夹作为工作区。...所以当我main.py写 from login import login的时候,PyCharm代码练习这个文件夹里面去寻找login.py文件。

3.9K10

fast.ai 机器学习笔记(一)

我们想要这样做的原因是因为 Kaggle 上,您只能提交很多次,如果您提交太频繁,最终您适应排行榜。现实生活,我们希望构建一个在生产中表现良好的模型。...有趣的是,尝试不时运行%prun需要 10-20 秒的代码上,看看你是否能学会解释和使用分析器输出。...如果你将 set_rf_samples 设置相对较小,而数据集很大,OOB 将需要很长时间来计算。希望某个时候,我们能够修复库,使其不再发生这种情况。没有理由需要那样,目前,库就是这样工作的。...基于树方差的置信度 正如我所提到的,当我们进行模型解释倾向于将set_rf_samples设置为某个子集——足够小,可以不到 10 秒内运行一个模型,因为运行一个超级准确的模型没有意义。...df_raw.plot('YearMade', 'saleElapsed', 'scatter', alpha=0.01, figsize=(10,8)); 当我这样,我们得到了这个非常丑陋的图表

26810

如何用Python抓取最便宜的机票信息(上)

另一个scraper 当我第一次开始做一些web抓取对这个主题不是特别感兴趣。但是想说!...如果想做更多的项目,包括预测模型、财务分析,或许还有一些情绪分析,事实证明,弄清楚如何构建第一个web爬虫程序非常有趣。不断学习的过程意识到网络抓取是互联网“工作”的关键。...请记住,没有在这里开辟新的领域。有更先进的方式找到便宜的交易,但我希望的文章分享一些简单实用的东西!...在编写代码考虑了结果页面,所以如果只想搜索特定的日期,很可能需要做一些调整。我会试着整篇文章中指出这些变化,如果你卡住了,请在评论留言给我。 点击搜索按钮,地址栏中找到链接。...从的测试来看,第一次搜索似乎总是没问题的,所以如果您想要摆弄代码,并且让代码它们之间有很长的间隔自动运行,那么实际上需要您自己来解决这个难题。你真的不需要10分钟更新这些价格,对吧?

3.7K20

二手车价格预测 | 构建AI模型并部署Web应用 ⛵

图片 基于机器学习对二手车交易价格进行预估,这一技术已经二手车交易平台中广泛使用。本篇内容,ShowMeAI 完整构建用于二手车价格预估的模型,并部署成web应用。...)[0]) 输出: 图片 我们发现有一些车品牌的别称或者拼写错误,我们做一点数据清洗如下: df['CarName'] = df['CarName'].str.lower() df['CarName'...如下: sns.histplot(data=df, x="price", kde=True) 图片 大家从图上可以看出这是一个有偏分布。...(另外一个考量是,如果我们以对数后的结果作为标签来建模学习,那还原回 price 的过程,会使用指数操作,这能保证我们得到的价格一定是正数) ,代码如下: #修复偏态分布 df["price_log"...]=np.log(df["price"]) sns.histplot(data=df, x="price_log", kde=True) 图片 校正过后的数据分布更接近正态分布了,做过这些基础处理之后,

2.6K51
领券