在本章中,我们将了解 Python 如何使用专门为数据分析和数据科学创建的算法和库来帮助我们理解和分析数据。我们将首先研究实验数据,然后讨论使用两个主要库的算法:NumPy和pandas。 在本章中,我们将介绍以下主题: 定义实验数据 在 Python 中使用数据库 用 ...
时间序列概况在日常生活和专业研究中都很常见。简而言之,时间序列概况是一系列连续的数据点 y(0), y(1), ..., y(t),其中时间 t 的点依赖于时间 t-1 的前一个点(或更早的时间点)。 在许多应用中,研究者致力于预测时间序列概况的未来行为。存在各种建模方法。
最近我们被客户要求撰写关于信用卡违约分析的研究报告,包括一些图形和统计输出。 本文中我们介绍了决策树和随机森林的概念,并在R语言中用逻辑回归、回归决策树、随机森林进行信用卡违约数据分析 决策树是由节点和分支组成的简单树状结构。根据每个 ...
说明:如果访问 GitHub 比较慢的话,可以关注我的知乎账号(Python-Jack),上面的“从零开始学Python”专栏(对应本项目前 20 天的内容)比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”、“说走就走的AI之旅”等也在持续更新中 ...
导语:本教程的主题是:如何用Python中的scikit-learn库,建立、训练和测试你的第一个线性回归机器学习模型。 字幕组双语原文:如何在 Python 中建立和训练线性和 logistic 回归 ML 模型? 线性回归与logistic回归,是目前最流行的两个机器学习模型。 在我的上一篇 ...
本文介绍了如何在 Python 中利用散点图矩阵(Pairs Plots)进行数据可视化。 如何快速构建强大的探索性数据分析可视化 当你得到一个很不错的干净数据集时,下一步就是探索性数据分析(Exploratory Data Analysis,EDA)。EDA 可以帮助发现数据想告诉我们什么,可用于 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果