暂无搜索历史
本文介绍用户群组分析Cohort analysis、RFM用户分层模型、Kmeans用户聚类模型的完整实施过程。
肺癌是全球范围内最常见的癌症之一,也是导致癌症相关死亡的主要原因。早期发现和诊断对于提高患者的生存率和治疗效果至关重要。
本文是UCI金融信贷数据集的第二篇文章:基于LightGBM的二分类建模。主要内容包含:
循环神经网络(1997)和卷积神经网络(2012):擅长处理图像等欧式数据或者文本和信号等序列数据
图表征学习(Graph Representation Learning,也称之为图表示学习)是专门针对图数据域的技术,旨在将图结构中的节点转化为具有连续数值的向...
XGBoost是Extreme Gradient Boosting的缩写,是一个非常流行的开源机器学习库,以其高性能和出色的准确性而闻名。它已广泛应用于各个领域...
最近开始看一本之前出版社老师赠送的书《图神经网络-基础、前言与应用》,开始系统地了解下图神经网络。
shap(SHapley Additive exPlanations)是一个用于解释机器学习模型输出的模型解释包。
基于Python Outlier Detection库进行异常值处理(Kmeans对异常值敏感)。
机器学习分类模型的评价指标是在衡量模型在未知数据集上的性能表现,通常基于混淆矩阵和相关的评价指标。
对数据进行平滑处理的方法有很多种,具体的选择取决于数据的性质和处理的目的。今天给大家分享9大常见数据平滑方法:
Plotly 是一个用于创建交互式数据可视化的 Python 库,它允许你轻松地生成各种类型的图表和图形,包括折线图、散点图、柱状图、饼图、热力图、3D 图等。
今天给大家分享一份关于数据分析、机器学习、深度学习、可视化的速查表,帮助你快速了解Python在数据科学领域的强大应用。
监督学习supervised learning:机器学习中最常见的类型,它可以学会将输入数据映射到已知目标annotation。比如回归问题和分类问题(二分类、...
首先求出训练集的均值和标准差,进行标准化;再使用训练集的均值和标准差对测试集进行标准化。
机器学习中的路透社数据集是一个非常常用的数据集,它包含来自新闻专线的文本数据,主要用于文本分类任务。这个数据集是由路透社新闻机构提供的,包含了大量的新闻文章,共...
之前也写过一些关于seaborn的文章,本文给大家介绍如何使用seaborn来绘制多子图。
超参数是在模型训练之外设置的选项,不会在训练过程中被优化或更改。相反,需要在训练之前手动设置它们,并且对模型的性能有很大的影响。
Python深度学习-深入理解Keras:Keras标准工作流程、回调函数使用、自定义训练循环和评估循环。
今天给大家介绍一个金融数据分析库yfinance,主要是基于该库下的股票数据分析及股价预测(使用LSTM模型)
暂未填写公司和职称
暂未填写学校和专业
暂未填写个人网址