专栏首页深度学习入门与实践【原】机器学习几个基本的问题

【原】机器学习几个基本的问题

  从今年四月份到现在已经工作快9个月了,最开始是做推荐系统,然后做机器学习,现在是文本挖掘,每个部分研究的时间都不多,但还是遇到了很多问题,目前就把一定要总结的问题总结一下,以后有时间多看看,提醒自己看有没有解决。

  推荐系统:

  1.冷启动热启动区别和联系?各个阶段需要的算法?

  2.每个算法的数学推导、适用情况、优缺点、改进方法、数据类型?

  3.如何平衡热启动时的准确率和召回率,两者不可能同时高,怎么平衡?从算法本身还是业务层面?惊喜度怎么添加?

  4.如何评价推荐系统的好坏?指标是啥?

  机器学习:

  1.能解决哪几类问题?(分类聚类回归预测?)每一类型会有哪些算法?

  2.每个算法优缺点各是什么?各能解决什么问题?侧重点是什么?对数据的平衡性要求大吗?对初始值敏感吗?需要的数据类型是什么?(数值 or 类别?或者混合使用?)

  3.每个算法是如何推导的?如果要调优要从哪些步骤着手?目前的局限是什么?(背后的数学依据)各个算法之间的联系和区别是啥?各算法之间可以结合吗?瓶颈和局限是什么?

  4.python的scikit-learn包是不是都熟悉了,源码有没有看过?自己尝试把每个算法写一下,看看和scikit-learn包跑起来有没有区别?精确度是否会提高?

  5.每个算法的评价指标是什么?(精确度召回度f1-score还有别的吗?)可视化有哪些方法?(ROC曲线?目前只知道这个,还有其他的吗?)

  文本挖掘

  1.基本步骤是啥?(清洗数据(缺失值、噪音数据、平滑处理)--->中文分词(各种方法)--->特征提取(tfidf还有其他几种方法) --->特征选择(卡方互信息发IG法等等)--->用机器学习算法跑)有没有漏的?或者有没有哪些步骤还有补充的可以提高精度的?

  2.各个步骤之间各有哪种方法?每种方法区别和联系?数学推导是什么?有没有可以改进的地方?有没有新的方法可以自己造的?

  3.数据编码转码不容忽视,不要忘记“不可见字符”(windows--->linux系统时候容易出现的问题)

  这是工作到现在觉得必须要解决的问题,以后有新的发现再补充。关于这些问题的解决,不定期的在博客里发出来,不断修改,不断添加,总之,学习是个不断迭代的过程,fighting!:)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【原】深度学习的一些经验总结和建议 | To do v.s Not To Do

    前言:本文同步发布于公众号:Charlotte数据挖掘,欢迎关注,获得最新干货~  

    Charlotte77
  • 2017年总结与2018年目标和计划

      前段时间看到版内经常会有2017年的总结,但我总觉得年还没过,2017就不算真正的过完,上周五公司开了部门年会,这周五公司要开公司年会,年会完了再过一周多就...

    Charlotte77
  • 机器学习基础与实践(一)----数据清洗

    本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢!   想写这个系列很久了,最近刚好项目结束了闲下来有点时间,...

    Charlotte77
  • 机器人算法专题介绍

    算法 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规...

    智能算法
  • 深度 | 谷歌和OpenAI新研究:如何使用达尔文进化论辅助设计人工智能算法?

    选自QZ 作者:Dave Gershgorn 机器之心编译 参与:吴攀、黄小天、李亚洲 现代机器智能建立在模仿自然的基础之上——这一领域的主要目的是在计算机中复...

    机器之心
  • 如何实现机器学习算法

    在代码中实现一个机器学习算法可以教你很多关于算法和它的工作原理。

    xixigiggling
  • 算法系列1 初识算法 算法复杂性模型 算法复杂度的计算

    定义:由若干条指令组成的有穷序列,且满足:输出输入,确定性,有限性 输入:有零个或多个由外部提供的量作为算法的输入 输出:算法产生至少一个量作为算法的输出 ...

    一只胡说八道的猴子
  • 【干货】机器学习常用35大算法盘点

    原文出处: http://weibo.com/ttarticle/p/show?id=2309404101186960678479&sudaref=foru...

    红色石头
  • 最新版AlphaGo(Master)的60胜预示着人类将是一种过时的算法?

    大数据文摘
  • 走下神坛吧,算法!

    在互联网、大数据、人工智能火爆的今天,“算法”这个词几乎妇孺皆知,业已成为“高薪”“牛X”的代名词。

    五分钟学算法

扫码关注云+社区

领取腾讯云代金券