前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2018 CCF《套餐个性化匹配模型》(亚军)分享

2018 CCF《套餐个性化匹配模型》(亚军)分享

作者头像
Coggle数据科学
发布2019-09-12 17:54:53
5450
发布2019-09-12 17:54:53
举报
文章被收录于专栏:Coggle数据科学Coggle数据科学

github链接:

PandasCute/2018-CCF-BDCI-China-Unicom-Research-Institute-top2​github.com

图标
图标

首先感谢:林有夕

inf.turing

提供这份PPT,听说干货满满

话不多说,接下来将会奉上完整版ppt

有人问上面的图怎么生成的,咳咳,敲黑板重点!!!

以下代码是w2v 的聚类结果TSNE 可视化图,良心干货

来源于郭大https://github.com/guoday

guoday - Overview​github.com

图标
图标
代码语言:javascript
复制
import pandas as pd
import multiprocessing
import numpy as np
import random
import sys
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
df=pd.read_csv('1_total_fee_w2v.csv')
l=list(df['1_total_fee'].astype('str'))
name=list(df)

def plot_with_labels(low_dim_embs, labels, filename = 'tsne.png'):
    assert low_dim_embs.shape[0] >= len(labels), "More labels than embeddings"
    plt.figure(figsize= (10, 18))
    for i, label in enumerate(labels):
        x, y = low_dim_embs[i, :]
        plt.scatter(x, y)
        plt.annotate(label, xy = (x, y), textcoords = 'offset points', ha = 'right', va = 'bottom')
    plt.savefig(filename) 

tsne = TSNE(perplexity = 30, n_components = 2, init = 'pca', n_iter = 5000)

plot_only = 300
low_dim_embs = tsne.fit_transform(df.iloc[:plot_only][name[1:]])
labels = [l[i] for i in range(plot_only)]
plot_with_labels(low_dim_embs, labels)

写在最后

要打造优质的产品:请把自己看成是一位出色的工程师,而不是一位机器学习专家。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档