网友这12个机器学习的问题 我们的算法工程师春节无休吐血回复Q&A下

欢迎关注数据超市微信公众号

Q: 自动化专业与人工智能是什么关系?

本人本科是自动化专业,但以后向往与人工智能有关的方面发展,现在有些搞不清人工智能与自动化的关系,有人说人工智能偏向于算法编程和自动化没什么关系,有人说人工智能与自动化有很大关系。我还想问下自动化考研方向中的模式识别与智能控制算是人工智能吗,还有自动化考人工智能的研算跨专业吗?字数有点多,谢谢大家。

本人本科就是自动化专业的,考研考的是控制工程小专硕,由于老师做的是图像处理方面的,就歪打误撞学了图像识别,就是你所说的人工智能,不过目前不搞这个玩意了,毕业做的数据挖掘,偏向于结构化的表数据,算法其实就是一个特征工程+调参的活儿,调参就像是一门玄学,PID模型你本科我想肯定接触过,和这个差不多,只不过参数有点少罢了。。最后,想给你说想要跨入人工智能行业偏工程一点的,你得会计算机基础的知识(数据结构和算法,计算机系统以及网络通信),这样你才可以走的很远。

Q: 本科学的软件工程,以后想往人工智能方面发展

有什么建议吗?考研的话有建议的方向吗?

这么好的一个专业为什么要转人工智能,喜欢学习数学还是感觉这行业挣钱多啊,不过我觉得你把基础打扎实了,比如数据结构和算法,计算机系统原理以及网络通信搞得明明白白,然后再学学机器学习和深度学习,基本上就OK了,感觉这个和计算机基础知识比真心不难的。想转很容易的。

Q: 如何对变化的数据采集分析?

如何对一个不断变化的医学监护仪进行摄像采集并进行数据分析,如果有异常则通过手机预警,过程大概哪些步骤和方法?感谢大神指点

我不知道你这个预警模型是人工制定规则还是训练一个时序模型来做?前期摄像采集?是采集的图像吗?我想知道为啥不能将医学监护仪中的图像数据直接实时输入到计算机?如果要是一帧帧的处理,就需要考验你对图像处理的速度了,不知道是否可以隔几帧分析处理一次图像呢?我记得视频一般是27帧/s的。。。

Q: 逻辑回归目标变量可以是连续型的吗?

如题,想请大神解答逻辑回归的目标变量是否可以是连续型的?比如是一个0~1之间的连续变量?以我自己的经验和理解,查了相关的资料,逻辑回归应该只能做分类,但是目前工作中有遇到这个疑惑,想请教大咖们的专业解答,谢谢!

线性回归的拟合函数,是对f(x)的输出变量y的拟合,而逻辑回归的拟合函数是对为1类的样本的概率的拟合。直接通过回归的方法去预测二分类问题, y 到底是0类还是1类,最好的函数是单位阶跃函数。然而单位阶跃函数不连续(GLM 的必要条件),而 logsitic 函数恰好接近于单位阶跃函数,且单调可微。于是希望通过该复合函数去拟合分类问题。

Q: 求教不平衡数据的训练集与测试集样本选择:

我正在用决策树提取不同类别的群体的特征,一共有四个群体,但是群体的数据不平衡,分别是1200多,800多,1000多,200多个数据,请问应该怎么进行训练集和测试集的划分与选择,谢谢!

用随机采样去做,尽量保持每个类别的样本数量一致。

半路出家学习人工智能需要什么注意事项?

各位大佬好!

小弟半路出家希望学习人工智能,问题多多,希望向各位大佬请教:

1. 小弟最擅长的软件是Mathematica,虽然v11的版本里有神经网络的命令。但是如果要深入的学习这门手艺,需要用哪种软件比较好?虽然网上多半推荐phyton,但是我看见也有用Matlab来做人工智能的,还有用C和C++或者Java来做的。能否请哪位大佬告知小弟,哪种语言比较好,或者这些语言来写机器学习程序各有什么优缺点?

2. 小弟看了许多入门书籍,但是还是不确定自己是否已经入门,能否给小弟推荐个入门书?并告知小弟,除了入门之外还需要阅读一些其他的什么书才能比较熟练?

3. 小弟希望能先制作语言翻译方面的人工智能程序,能否请大佬根据我的这个兴趣方向,给我推荐一下计算机语言和人工智能的教学书籍?

建议楼主先学习机器学习基础的内容,分类回归等等模型算法。然后学习python语言,了解深度学习算法。学习深度学习框架tensorflow。看到楼主说想要做翻译模型,那就必须看看attention模型了。总之要学习的有很多,慢慢来.

Q: [研究方向求助]深度学习+计算机视觉

目前研一,大概方向想往计算机视觉+深度学习,因为知道得很浅所以也说不出实质性的东西。

有点往 面部表情识别 或者 步态识别 或者语义分割之类的方向发展,但是对这些仅仅有概念上的理解。希望有前辈能够指点一二,有什么方向比较建议入的?

我觉得如果实验室没有这样很好的硬件环境(GPU)的话,搞人工智能图像还是比较难的,不过也未必不可以,因为现在大家都在水相关的视觉论文。我是觉得视觉这块领域还是挺难的,因为不仅仅需要深度学习领域的算法,图像自身的算法也挺多的。越是难,越是有价值。加油吧,少年。我觉得和视觉识别相关的领域都是不错的领域。努力写一篇高质量的paper.

Q: 博士阶段,机器视觉研究方向推荐介绍

本校直博生,导师的研究方向也不是机器视觉,对自己方向确定没有很大建议。。。

现在入学半年了,现在还没有确定自己的研究方向,感觉很茫然。

想来求助虫友,推荐下机器视觉研究方向及目前的热点。。。。。还有最好能适合博士阶段开展的。。。

本人本科机械专业,也不想现在研究方向做纯图像处理,那样自己也竞争不过信息学院的啊。

Q: 机器学习领域是否已经达到饱和?

纵观知乎,很多人都在做机器学习的相关研究,请问现在机器学习领域是否饱和了呢?以及市场上真的需要如此多的机器学习的人才?机器学习未来是否会成为第二个泡沫?

Q: 机器学习模型如何上线Spark集群?

对于一个线下构建模型、线上预测打标记的场景

在线下部分,模型可能来自Sklearn,可能来自Knime

需要在线上使用Spark进行ETL,对大批量数据添加分类或回归结果列

我尝试使用pmml,发现这东西也分4.2、4.3等版本,我不能控制对方给过来的版本

如果模型很复杂,我不清楚pmml能否很好的支持

jpmml这个库不知道在工程界实践效果如何,集群上似乎有坑

另外,在Spark方重新用mllib构建一个model,不知道是否科学合理,如果模型很复杂或者用了一些新生的库,则不容易实现

请教各位前辈线上部分使用什么技术栈,有没有一些踩坑记录,谢谢!

能否将训练好的模型封装成一个API接口,然后put你ETL的数据给到这个接口然后predict出结果返回呢?之前公司训练模型就是这么做的,恕我见识短,不太了解pmml这个东西.

Q: 如何保证标注的准确性和可信性?

在进行机器学习、深度学习、分类的时候,我们往往需要人工标注大量的数据,俗话说“有多少人工,就有多少智能”,标注费时费力,一般需要多个人参与,那么怎么保证人工标注的准确性和可信性呢?求大神分享经验教训和方法,谢谢。

人多力量大,让老板把标注任务下达到公司每个员工手里,每天标注10张图片,100个员工就1000张,每天由专门的人来审核校验,一个月就30万张,应该足够你训练一个分类模型了。

Q: 人工智能为什么会被人觉得带来威胁?

题主以为人工智能是人类编码的,严格执行代码要求的程序,不是很懂为什么会有惧怕。

早上在路上听到罗胖讲《人类的终极竞争力》里面说人有权利,这是人类社会的一种独有现象。动物完全没有权利概念,它们有的只是能力。能力不在场,它占有的东西就会被夺取,而权利不一样,即使人不在场,周围的人也会尊重、维护你的权利。。为什么人有权利和动物没有呢,因为这是人们的信念和想象力在起作用。重点来了,人和动物的最大区别就是人有信念和想象力。有了这个,人类社会才有可能构建,人类社会一切的法律规则以及约束大家也才会遵守,因为这一切都是在共同想象力的基础上认同的。当下的人工智能连洗衣拖地带孩子都不会,而且在未来依旧看不到可能,但是会下的一手的好棋,这是因为算法不会产生情感,不会有想象力,不会有意识,它只会逻辑运算,只会一股脑的按照逻辑来,按照人类的指定的方式来,只不过比人类速度快一些,计算能力强一些罢了。所以创造力的高低并不是决定是否会被取代的决定性因素,想象力是上帝赋予人类这个物种最宝贵的财富,也只有拥有了想象力,你才能感受到威胁。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180214A0DNFR00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励