# Kaggle放大招：简单几步实现海量数据分析及可视化

【新智元导读】近期，Kaggle发布了新的数据分析及可视化工具——Kaggle Kerneler bot，用户只需上传数据集，便可用Python为用户自动获取相关的深度数据分析结果。本文将带领读者体验一下这款便捷而又高效的工具。

Kaggle Kerneler bot是一个自动生成的kernel，其中包含了演示如何读取数据以及分析工作的starter代码。用户可以进入任意一个已经发布的项目，点击顶部的“Fork Notebook”来编辑自己的副本。接下来，小编将以最热门的两个项目作为例子，带领读者了解该如何使用这款便捷的工具。

In [1]：

from mpl_toolkits.mplot3d import Axes3D
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt # plotting
import numpy as np # linear algebra
import os # accessing directory structure
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

In [2]：

print(os.listdir('../input'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/007_nagato_yuki'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/046_alice_margatroid'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/065_sanzenin_nagi'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/080_koizumi_itsuki'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/096_golden_darkness'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/116_pastel_ink'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/140_seto_san'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/144_kotegawa_yui'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/164_shindou_chihiro'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/165_rollo_lamperouge'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/199_kusugawa_sasara'))
print(os.listdir('../input/moeimouto-faces/moeimouto-faces/997_ana_coppola'))

In [7]：

nRowsRead = 100 # specify 'None' if want to read whole file
# color.csv may have more rows in reality, but we are only loading/previewing the first 100 rows
df1.dataframeName = 'color.csv'
nRow, nCol = df1.shape
print(f'There are {nRow} rows and {nCol} columns')

In [8]：

Out [8]：

In [9]：

plotHistogram(df1, 10, 5)

In [10]：

plotPCA(df1, 2) # 2D PCA
plotPCA(df1, 3) # 3D PCA

In [11]：

plotCorrelationMatrix(df1, 8)

In [12]：

plotScatterMatrix(df1, 20, 10)

https://www.kaggle.com/kerneler/kernels

0 条评论

## 相关文章

43460

42260

45640

### 【解放程序员】MIT“创世纪”机器学习新系统，自动生成补丁修复Bug

【新智元导读】当您辛辛苦苦写了大半年程序，终于要享受一下国庆长假的时候，别让 bug 把您的假期毁了。MIT 研究团队开发了一个称为“创世纪”的系统，能够对以前...

37650

### 安卓手机如何玩转动作手势检测？有TensorFlow就够了，附实用教程

? 原文来源：Lemberg Solutions Ltd 作者：Zahra Mahoor、Jack Felag、 Josh Bongard 编译：嗯~阿童木呀...

43670

36060

### 让 TensorFlow 估算器的推断提速百倍，我是怎么做到的？

TensorFlow 估算器提供了一套中阶 API 用于编写、训练与使用机器学习模型，尤其是深度学习模型。在这篇博文中，我们描述了如何通过使用异步执行来避免每次...

17520

33520

56880