【干货荟萃】机器学习&深度学习知识资料大全集(二)(论文/教程/代码/书籍/数据/课程等)

【导读】转载来自ty4z2008(GItHub)整理的机器学习&深度学习知识资料大全荟萃,包含各种论文、代码、视频、书籍、文章、数据等等。是学习机器学习和深度学习的必备品!

ty4z2008前言:希望转载的朋友,你可以不用联系我.但是一定要保留原文链接,因为这个项目还在继续也在不定期更新.希望看到文章的朋友能够学到更多.此外:某些资料在中国访问需要梯子.

昨天介绍了第一篇:

【干货荟萃】机器学习&深度学习知识资料大全集(一)(论文/教程/代码/书籍/数据/课程等)

今天第二篇:

  • 《Image Scaling using Deep Convolutional Neural Networks》
  • http://engineering.flipboard.com/2015/05/scaling-convnets/

介绍:使用卷积神经网络的图像缩放.

  • 《Proceedings of The 32nd International Conference on Machine Learning》
  • http://jmlr.org/proceedings/papers/v37/

介绍:ICML2015 论文集,优化4个+稀疏优化1个;强化学习4个,深度学习3个+深度学习计算1个;贝叶斯非参、高斯过程和学习理论3个;还有计算广告和社会选择.ICML2015 Sessions.

  • 《Image Scaling using Deep Convolutional Neural Networks》
  • http://engineering.flipboard.com/2015/05/scaling-convnets/

介绍:使用卷积神经网络的图像缩放.

  • 《Microsoft researchers accelerate computer vision accuracy and improve 3D scanning models》
  • http://blogs.technet.com/b/inside_microsoft_research/archive/2015/06/08/microsoft-researchers-accelerate-computer-vision-accuracy-and-improve-3d-scanning-models.aspx

介绍:,第28届IEEE计算机视觉与模式识别(CVPR)大会在美国波士顿举行。微软研究员们在大会上展示了比以往更快更准的计算机视觉图像分类新模型,并介绍了如何使用Kinect等传感器实现在动态或低光环境的快速大规模3D扫描技术.

  • 《Machine Learning for Humans》
  • https://github.com/marcotcr/mlforhumans

介绍:(文本)机器学习可视化分析工具.

  • 《A Plethora of Tools for Machine Learning》
  • http://knowm.org/machine-learning-tools-an-overview/

介绍:机器学习工具包/库的综述/比较.

  • 《The art of visualizing visualizations: a best practice guide》
  • http://sapblog.be/en/the-art-of-visualizing-visualizations-a-best-practice-guide/

介绍:数据可视化最佳实践指南.

  • 《MIT Machine Learning for Big Data and Text Processing Class Notes - Day 1》
  • http://blog.adnanmasood.com/2015/06/08/mit-machine-learning-for-big-data-and-text-processing-class-notes-day-1/

介绍:Day 1、Day 2、Day 3、Day 4、Day 5.

  • 《Getting “deep” about “deep learning”》
  • http://whatsnext.nuance.com/in-the-labs/what-is-deep-machine-learning/

介绍:深度学习之“深”——DNN的隐喻分析.

  • 《Mixture Density Networks》
  • http://blog.otoro.net/2015/06/14/mixture-density-networks/

介绍:混合密度网络.

  • 《Interview Questions for Data Scientist Positions》
  • https://medium.com/@D33B/interview-questions-for-data-scientist-positions-5ad3c5d5b8bd

介绍:数据科学家职位面试题.

  • 《Accurately Measuring Model Prediction Error》
  • http://scott.fortmann-roe.com/docs/MeasuringError.html

介绍:准确评估模型预测误差.

  • 《Continually updated Data Science Python Notebooks》
  • https://github.com/donnemartin/data-science-ipython-notebooks

介绍:Continually updated Data Science Python Notebooks.

  • 《How to share data with a statistician》
  • https://github.com/jtleek/datasharing

介绍:How to share data with a statistician.

  • 《The Eyescream Project NeuralNets dreaming natural images》
  • http://soumith.ch/eyescream/

介绍:来自Facebook的图像自动生成.

  • 《How to share data with a statistician》
  • https://github.com/jtleek/datasharing

介绍:How to share data with a statistician.

  • 《A Neural Conversational Model》
  • http://arxiv.org/abs/1506.05869

介绍:(Google)神经(感知)会话模型.

  • 《The 50 Best Masters in Data Science》
  • http://www.datasciencecentral.com/profiles/blogs/the-50-best-masters-in-data-science

介绍:The 50 Best Masters in Data Science.

  • 《NLP常用信息资源》
  • http://forum.memect.com/thread/nlp%E5%B8%B8%E7%94%A8%E4%BF%A1%E6%81%AF%E8%B5%84%E6%BA%90/

介绍:NLP常用信息资源.

  • 《Conditional Random Fields as Recurrent Neural Networks》
  • http://www.robots.ox.ac.uk/~szheng/papers/CRFasRNN.pdf

介绍:语义图像分割的实况演示,通过深度学习技术和概率图模型的语义图像分割.

  • 《Fully Convolutional Networks for Semantic Segmentation》
  • http://www.cs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf

介绍:Caffe模型/代码:面向图像语义分割的全卷积网络,模型代码.

  • 《Growing Pains for Deep Learning》
  • http://cacm.acm.org/news/188737-growing-pains-for-deep-learning/fulltext

介绍:深度学习——成长的烦恼.

  • 《Clustering Text Data Streams – A Tree based Approach with Ternary Function and Ternary Feature Vector 》
  • http://www.sciencedirect.com/science/article/pii/S1877050914005274

介绍:基于三元树方法的文本流聚类.

  • 《Foundations and Advances in Data Mining》
  • http://cs.ucla.edu/~wwc/course/cs245a/mining%20book.pdf

介绍:Free Ebook:数据挖掘基础及最新进展.

  • 《The Deep Learning Revolution: Rethinking Machine Learning Pipelines》
  • http://www.infoq.com/presentations/deep-learning

介绍:深度学习革命.

  • 《The Definitive Guide to Do Data Science for Good》
  • http://blog.datalook.io/definitive-guide-data-science-good/

介绍:数据科学(实践)权威指南.

  • 《Microsoft Academic Graph》
  • http://research.microsoft.com/en-us/projects/mag/

介绍:37G的微软学术图谱数据集.

  • 《Challenges and Opportunities Of Machine Learning In Production》
  • https://www.youtube.com/watch?v=UEwDwTkWwdc&hd=1

介绍:生产环境(产品级)机器学习的机遇与挑战.

  • 《Neural Nets for Newbies》
  • https://www.youtube.com/watch?v=Cu6A96TUy_o

介绍:神经网络入门.

  • 《A Nearly-Linear Time Framework for Graph-Structured Sparsity》
  • http://jmlr.org/proceedings/papers/v37/hegde15.pdf

介绍:来自麻省理工的结构化稀疏论文.

  • 《Optimal and Adaptive Algorithms for Online Boosting》
  • http://jmlr.org/proceedings/papers/v37/beygelzimer15.pdf

介绍:来自雅虎的机器学习小组关于在线Boosting的论文 .

  • 《Top 20 Python Machine Learning Open Source Projects》
  • http://www.kdnuggets.com/2015/06/top-20-python-machine-learning-open-source-projects.html

介绍:20个最热门的开源(Python)机器学习项目.

  • 《The Parallel C++ Statistical Library for Bayesian Inference: QUESO》
  • http://arxiv.org/abs/1507.00398

介绍:C++并行贝叶斯推理统计库QUESO,github code.

  • 《《Deep learning》Yann LeCun, Yoshua Bengio, Geoffrey Hinton (2015) 》
  • http://www.nature.com/nature/journal/v521/n7553/full/nature14539.html

介绍:Nature:LeCun/Bengio/Hinton的最新文章《深度学习》,Jürgen Schmidhuber的最新评论文章《Critique of Paper by "Deep Learning Conspiracy" (Nature 521 p 436)》.

  • 《Palladium》
  • https://github.com/ottogroup/palladium

介绍:基于Scikit-Learn的预测分析服务框架Palladium.

  • 《Advances in Structured Prediction》
  • http://hunch.net/~l2s/merged.pdf

介绍:John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片.

  • 《100 open source Big Data architecture papers for data professionals》
  • https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan

介绍:读完这100篇论文 就能成大数据高手,国内翻译.

  • 《Social Media & Text Analytics》
  • http://socialmedia-class.org/syllabus.html

介绍:NLP课程《社交媒体与文本分析》精选阅读列表.

  • 《Machine Learning for Developers》
  • http://xyclade.github.io/MachineLearning/

介绍:写给开发者的机器学习指南.

  • 《Hot news detection using Wikipedia》
  • http://hameddaily.blogspot.com/2015/06/hot-news-detection-using-wikipedia_29.html

介绍:基于维基百科的热点新闻发现.

  • 《Harvard Intelligent Probabilistic Systems Group》
  • https://github.com/HIPS

介绍:(Harvard)HIPS将发布可扩展/自动调参贝叶斯推理神经网络.

  • 《An Empirical Exploration of Recurrent Network Architectures》
  • http://jmlr.org/proceedings/papers/v37/jozefowicz15.html

介绍:面向上下文感知查询建议的层次递归编解码器.

  • 《Efficient Training of LDA on a GPU by Mean-for-Mode Estimation》
  • http://jmlr.org/proceedings/papers/v37/tristan15.html

介绍:GPU上基于Mean-for-Mode估计的高效LDA训练.

  • 《From the Lab to the Factory: Building a Production Machine Learning Infrastructure》
  • https://www.youtube.com/watch?v=v-91JycaKjc&hd=1

介绍:从实验室到工厂——构建机器学习生产架构.

  • 《6 Useful Databases to Dig for Data (and 100 more)》
  • http://piktochart.com/6-useful-databases-to-dig-for-data/

介绍:适合做数据挖掘的6个经典数据集(及另外100个列表).

  • 《Deep Networks for Computer Vision at Google – ILSVRC2014》
  • http://www.computervisiontalks.com/deep-networks-for-computer-vision-at-google/

介绍:Google面向机器视觉的深度学习.

  • 《How to choose a machine learning API to build predictive apps》
  • https://medium.com/@louisdorard/developer-considerations-for-choosing-a-machine-learning-api-20e2de15eb3a

介绍:构建预测类应用时如何选择机器学习API.

  • 《Exploring the shapes of stories using Python and sentiment APIs》
  • https://indico.io/blog/plotlines/

介绍:Python+情感分析API实现故事情节(曲线)分析.

  • 《Movie selection using R》
  • http://melodywolk.com/2015/07/21/movie-selection-using-r/

介绍:(R)基于Twitter/情感分析的口碑电影推荐,此外推荐分类算法的实证比较分析.

  • 《A Tutorial on Graph-based Semi-Supervised Learning Algorithms for NLP》
  • http://graph-ssl.wdfiles.com/local--files/blog%3A_start/graph_ssl_acl12_tutorial_slides_final.pdf

介绍:CMU(ACL 2012)(500+页)面向NLP基于图的半监督学习算法.

  • 《Arbitrariness of peer review: A Bayesian analysis of the NIPS experiment》
  • http://arxiv.org/abs/1507.06411

介绍:从贝叶斯分析NIPS,看同行评审的意义.

  • 《Basics of Computational Reinforcement Learning》
  • http://videolectures.net/rldm2015_littman_computational_reinforcement/

介绍:(RLDM 2015)计算强化学习入门.

  • 《Deep Reinforcement Learning》
  • http://videolectures.net/rldm2015_silver_reinforcement_learning/

介绍:David Silver的深度强化学习教程.

  • 《On Explainability of Deep Neural Networks》
  • http://blog.adnanmasood.com/2015/07/31/on-explainability-of-deep-neural-networks/

介绍:深度神经网络的可解释性.

  • 《The Essential Spark Cheat Sheet》
  • http://info.mapr.com/rs/mapr/images/rd204-010d-spark_0.pdf

介绍:Spark快速入门.

  • 《Machine Learning for Sports and Real Time Predictions》
  • http://www.thetalkingmachines.com/blog/2015/7/30/machine-learning-for-sports-and-real-time-predictions

介绍:TalkingMachines:面向体育/政治和实时预测的机器学习.

  • 《CS224W: Social and Information Network Analysis Autumn 2014》
  • http://web.stanford.edu/class/cs224w/index.html

介绍:Stanford社交网络与信息网络分析课程资料+课设+数据.

  • 《RL Course by David Silver》
  • https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

介绍:David Silver(DeeMind)的强化学习课程,slide.

  • 《Faster deep learning with GPUs and Theano》
  • http://blog.dominodatalab.com/gpu-computing-and-deep-learning/

介绍:基于Theano/GPU的高效深度学习.

  • 《Introduction to R Programming》
  • https://www.edx.org/course/introduction-r-programming-microsoft-dat204x

介绍:来自微软的<R编程入门>.

  • 《Golang:Web Server For Performing Sentiment Analysis》
  • https://github.com/cdipaolo/sentiment-server

介绍:(Go)情感分析API服务Sentiment Server.

  • 《A Beginner’s Guide to Restricted Boltzmann Machines》
  • http://deeplearning4j.org/restrictedboltzmannmachine.html

介绍:受限波尔兹曼机初学者指南.

  • 《KDD2015十年最佳论文》
  • http://www.kdd.org/kdd2015/program.html

介绍:Mining and Summarizing Customer Reviews ,Mining High-Speed Data Streams,Optimizing Search Engines using Clickthrough Data.

  • 《Nvidia Deep Learning Courses》
  • http://www.hellophp.cn/archives/733

介绍:Nvidia深度学习课程.

  • 《Deep Learning Summer School 2015》
  • https://sites.google.com/site/deeplearningsummerschool/

介绍:2015年深度学习暑期课程,推荐讲师主页.

  • 《百度深度学习的图像识别进展》
  • http://www.cvrobot.net/image-recognition-progression-based-on-deep-learning-by-baidu/

介绍:这是一篇关于百度文章《基于深度学习的图像识别进展:百度的若干实践》的摘要,建议两篇文章结合起来阅读.

  • 《Machine Learning Methods in Video Annotation》
  • http://rnd.azoft.com/machine-learning-methods-video-annotation/

介绍:视频标注中的机器学习技术.

  • 《Training Recurrent Neural Networks》
  • http://www.cs.utoronto.ca/~ilya/pubs/ilya_sutskever_phd_thesis.pdf

介绍:博士论文:(Ilya Sutskever)RNN训练.

  • 《On Explainability of Deep Neural Networks》
  • http://blog.adnanmasood.com/2015/07/31/on-explainability-of-deep-neural-networks/

介绍:深度神经网络的灰色区域:可解释性问题,中文版.

  • 《Machine Learning Libraries in GoLang by Category》
  • http://www.fodop.com/ar-1002

介绍:Golang 实现的机器学习库资源汇总.

  • 《A Statistical View of Deep Learning》
  • http://blog.shakirm.com/wp-content/uploads/2015/07/SVDL.pdf

介绍:深度学习的统计分析.

  • 《Deep Learning For NLP - Tips And Techniques》
  • http://www.researchgate.net/publication/279853751DEEP_LEARNING_FOR_NLP-_TIPS_AND_TECHNIQUES

介绍:面向NLP的深度学习技术与技巧.

  • 《CrowdFlower Competition Scripts: Approaching NLP》
  • http://blog.kaggle.com/2015/08/18/crowdflower-scripts-approaching-nlp/

介绍:Kaggle's CrowdFlower竞赛NLP代码集锦.

  • 《CS224U: Natural Language Understanding》
  • http://web.stanford.edu/class/cs224u/index.html

介绍:斯坦福的自然语言理解课程.

  • 《Deep Learning and Shallow Learning》
  • http://freemind.pluskid.org/machine-learning/deep-learning-and-shallow-learning/

介绍:Deep Learning与Shallow Learning 介绍

  • 《A First Encounter with Machine Learning》
  • http://www.ics.uci.edu/~welling/teaching/ICS273Afall11/IntroMLBook.pdf

介绍:这是一本机器学习的电子书,作者Max Welling先生在机器学习教学上面有着丰富的经验,这本书小但精致.

  • 《Click Models for Web Search》
  • http://clickmodels.weebly.com/uploads/5/2/2/5/52257029/mc2015-clickmodels.pdf

介绍:由荷兰阿姆斯特丹大学 & 谷歌瑞士著.

  • 《Hinton CSC321课程/Deep Learning/Notes on CNN/Python/Theano/CUDA/OpenCV/...》
  • http://www.cnblogs.com/shouhuxianjian/p/4529235.html

介绍:介绍个乐于总结和翻译机器学习和计算机视觉类资料的博客,包含的内容:Hinton的CSC321课程的总结;Deep Learning综述;Notes on CNN的总结;python的原理总结;Theano基础知识和练习总结;CUDA原理和编程;OpenCV一些总结.

  • 《Which Algorithm Family Can Answer My Question?》
  • http://blogs.technet.com/b/machinelearning/archive/2015/09/01/which-algorithm-family-can-answer-my-question.aspx

介绍:针对具体问题(应用场景)如何选择机器学习算法(系列).

  • 《Free Data Science Books》
  • http://www.learndatasci.stfi.re/free-books/

介绍:数据科学免费书分类集合

  • 《Tutorial 4: Deep Learning for Speech Generation and Synthesis》
  • http://www.superlectures.com/iscslp2014/tutorial-4-deep-learning-for-speech-generation-and-synthesis

介绍:深度学习在语音合成最新进展有哪些?推荐MSRA的Frank Soong老师关于语音合成的深度学习方法的录像和幻灯片与以及谷歌的LSTM-RNN合成介绍,论文

  • 《The Art of Data Science》
  • https://leanpub.com/artofdatascience

介绍:新书(可免费下载):数据科学的艺术

  • 《Pattern Recognition and Machine Learning》
  • http://research.microsoft.com/en-us/um/people/cmbishop/prml/

介绍:模式识别与机器学习书籍推荐,本书是微软剑桥研究院大神Bishop所写,算是最为广为认知的机器学习教材之一,内容覆盖全面,难度中上,适合研究生中文版 or 备份

  • 《an introduction to visualizing DATA》
  • http://piksels.com/wp-content/uploads/2009/01/visualizingdata.pdf

介绍:数据可视化介绍(23页袖珍小册子)

  • 《That’s So Annoying!!!: A Lexical and Frame-Semantic Embedding Based Data Augmentation Approach to Automatic Categorization of Annoying Behaviors using #petpeeve Tweets ∗》
  • https://www.cs.cmu.edu/~yww/papers/emnlp2015petpeeves.pdf

介绍:这篇论文荣获EMNLP2015的最佳数据/资源奖优秀奖,标注的推特数据集

  • 《26 Things I Learned in the Deep Learning Summer School》
  • http://www.marekrei.com/blog/26-things-i-learned-in-the-deep-learning-summer-school/

介绍:作者在深度学习的思考.

  • 《Data-Visualization Tools & Books》
  • http://keshif.me/demo/VisTools

介绍:数据可视化常用工具软件资源汇总

  • 《Machine Learning and Probabilistic Graphical Models Course》
  • http://www.cedar.buffalo.edu/~srihari/CSE574/

介绍:Buffalo大学教授Sargur Srihari的“机器学习和概率图模型”的视频课程

  • 《Understanding Machine Learning: From Theory to Algorithms》
  • http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/index.html

介绍:耶路撒冷希伯来大学教授Shai Shalev-Shwartz和滑铁卢大学教授Shai Ben-David的新书Understanding Machine Learning: From Theory to Algorithms,此书写的比较偏理论,适合对机器学习理论有兴趣的同学选读

  • 《Machine Learning Checklist》
  • http://machinelearningmastery.com/machine-learning-checklist/

介绍:机器学习学习清单

  • 《NLP界有哪些神级人物?》
  • http://www.zhihu.com/question/32318281

介绍:知乎上面的一篇关于NLP界有哪些神级人物?提问。首推Michael Collins

  • 《机器学习温和指南》
  • http://www.csdn.net/article/2015-09-08/2825647

介绍:机器学习与NLP专家、MonkeyLearn联合创始人&CEO Raúl Garreta面向初学者大体概括使用机器学习过程中的重要概念,应用程序和挑战,旨在让读者能够继续探寻机器学习知识。

  • 《Gradient Boosted Regression Trees》
  • http://nbviewer.ipython.org/github/pprett/pydata-gbrt-tutorial/blob/master/gbrt-tutorial.ipynb

介绍:(IPN)基于Scikit-Learn的GBRT(Gradient Boost Regression Tree)教程,slide

  • 《Apache SINGA : Distributed Deep Learning System》
  • http://www.comp.nus.edu.sg/~dbsystem/singa/

介绍: 无需做深度学习就能用的分布式深度学习软件.

  • 《E-commerce Recommendation with Personalized Promotion》
  • http://dl.acm.org/citation.cfm?id=2800178

介绍: 在亚马逊数据和众包Mechanical Turk上,实现了来自彩票和拍卖的机制,以收集用户对产品的乐意购买价格(WTP,willingness-to-pay)训练集。 E-commerce Recommendation with Personalized Promotion [Zhao,RecSys15] 回归模型预测未知WTP,提升卖家利润和消费者满意度

  • 《Scalable Machine Learning》
  • https://www.edx.org/course/scalable-machine-learning-uc-berkeleyx-cs190-1x

介绍:来自伯克利分校的大规模机器学习.

  • 《机器学习资料大汇总》
  • http://www.52ml.net/star

介绍:来自52ml的机器学习资料大汇总.

  • 《Automatic Summarization》
  • http://www.cis.upenn.edu/~nenkova/1500000015-Nenkova.pdf

介绍:这本书的作者McKeown是2013年世界首个数据科学院(位于哥伦比亚大学)主任,她亦是ACL、AAAI和ACM Fellow .

  • 《Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing》
  • http://www.emnlp2015.org/proceedings/EMNLP/index.html

介绍:EMNLP-15文本摘要若干.

  • 《Recommender Systems (Machine Learning Summer School 2014 @ CMU)》
  • http://www.slideshare.net/xamat/recommender-systems-machine-learning-summer-school-2014-cmu

介绍:来自Netflix的Xavier Amatriain在Summer School 2014 @ CMU上长达4小时的报告,共248页,是对推荐系统发展的一次全面综述,其中还包括Netflix在个性化推荐方面的一些经验介绍.

  • 《BigData Stream Mining》
  • http://www.ecmlpkdd2015.org/sites/default/files/ECMLPKDD2015Slides.pdf

介绍:(ECML PKDD 2015)大数据流挖掘教程,此外推荐ECML PKDD 2015 Tutorial列表.

  • 《Deep learning on Spark with Keras》
  • https://github.com/maxpumperla/elephas

介绍:Spark上的Keras深度学习框架Elephas.

  • 《Prof. Surya Ganguli - The statistical physics of deep learning》
  • https://www.youtube.com/watch?v=7KCWcx-YIRI&hd=1

介绍:Surya Ganguli深度学习统计物理学.

  • 《(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表》
  • http://cmlakhan.github.io/courses/videos.html

介绍:(系统/算法/机器学习/深度学习/图模型/优化/...)在线视频课程列表.

  • 《Introduction to Topic Modeling in Python》
  • http://chdoig.github.io/pytexas2015-topic-modeling/

介绍:(PyTexas 2015)Python主题建模.

  • 《Large Scale Distributed Deep Learning on Hadoop Clusters》
  • http://yahoohadoop.tumblr.com/post/129872361846/large-scale-distributed-deep-learning-on-hadoop/

介绍:Hadoop集群上的大规模分布式机器学习.

  • 《Top Deep Learning Employers Based On LinkedIn Data》
  • http://www.vordot.com/deep-learning-employers-w-12020/

介绍:基于LinkedIn数据得出的深度学习热门"东家"排行.

  • 《Neural Net in C++ Tutorial》
  • https://vimeo.com/19569529

介绍:(c++)神经网络手把手实现教程.

  • 《Large-scale CelebFaces Attributes (CelebA) Dataset》
  • http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

介绍:香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集: Large-scale CelebFaces Attributes (CelebA) Dataset 10K 名人,202K 脸部图像,每个图像40余标注属性.

  • 《Unsupervised Feature Learning in Computer Vision》
  • https://www.cs.nyu.edu/web/Research/Theses/goroshin_ross.pdf

介绍:面向机器视觉的无监督特征学习,Ross Goroshin's webpage.

  • 《Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks》
  • http://arxiv.org/pdf/1506.03099v3.pdf

介绍:谷歌研究院Samy Bengio等人最近写的RNN的Scheduled Sampling训练方法论文.

  • 《Essential Machine Learning Algorithms in a nutshell》
  • https://manish.wordpress.com/2015/10/02/essential-machine-learning-algorithms-in-a-nutshell/

介绍:机器学习基本算法简要入门.

  • 《A Huge List of Machine Learning And Statistics Repositories》
  • http://blog.josephmisiti.com/a-huge-list-of-machine-learning-repositories/

介绍:Github机器学习/数学/统计/可视化/深度学习相关项目大列表.

  • 《Information Processing and Learning》
  • http://www.cs.cmu.edu/~aarti/Class/10704_Spring15/lecs.html

介绍:CMU的信息论课程.

  • 《Scheduled sampling for sequence prediction with recurrent neural networks》
  • http://arxiv.org/pdf/1506.03099v3.pdf

介绍:谷歌研究院Samy Bengio等人最近写的RNN的Scheduled Sampling训练方法论文.

  • 《基于Hadoop集群的大规模分布式深度学习》
  • http://www.csdn.net/article/2015-10-01/2825840

介绍:基于Hadoop集群的大规模分布式深度学习.

  • 《Learning both Weights and Connections for Efficient Neural Networks习》
  • http://arxiv.org/abs/1506.02626

介绍:来自斯坦福大学及NVIDIA的工作,很实在很实用。采用裁剪网络连接及重训练方法,可大幅度减少CNN模型参数。针对AlexNet、VGG等模型及ImageNet数据,不损失识别精度情况下,模型参数可大幅度减少9-13倍.

  • 《Apache Singa --A General Distributed Deep Learning Platform》
  • http://www.comp.nus.edu.sg/~dbsystem/singa/

介绍:无需做深度学习就能用的分布式深度学习软件,github.

  • 《24 Ultimate Data Scientists To Follow in the World Today》
  • http://www.analyticsvidhya.com/blog/2015/09/ultimate-data-scientists-world-today/

介绍:当今世界最NB的25位大数据科学家,通过他们的名字然后放在google中搜索肯定能找到很多很棒的资源译文.

  • 《Deep Learning for NLP - Lecture October 2015》
  • https://github.com/nreimers/deeplearning4nlp-tutorial/tree/master/2015-10_Lecture/

介绍:Nils Reimers面向NLP的深度学习(Theano/Lasagne)系列教程.

  • 《Connection between probability theory and real analysis》
  • https://ccle.ucla.edu/mod/page/view.php?id=834267

介绍:主讲人是陶哲轩,资料Probability: Theory and Examples,笔记.

  • 《Data Science Learning Resources》
  • http://www.districtdatalabs.com/#!resources/c21hq

介绍:数据科学(学习)资源列表.

  • 《8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset》
  • http://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/

介绍:应对非均衡数据集分类问题的八大策略.

  • 《Top 20 Data Science MOOCs》
  • https://datarithms.wordpress.com/2015/08/16/top-20-data-science-moocs/

介绍:重点推荐的20个数据科学相关课程.

  • 《Recurrent Neural Networks》
  • https://shapeofdata.wordpress.com/2015/10/20/recurrent-neural-networks/

介绍:递归神经网络.

  • 《Histograms of Oriented Gradients》
  • http://www.cs.duke.edu/courses/fall15/compsci527/notes/hog.pdf

介绍:(HOG)学习笔记.

  • 《Computational modelling courses》
  • http://aidanhorner.blogspot.co.uk/2015/10/computational-modelling-courses.html

介绍:计算建模/计算神经学课程汇总.

  • 《How We Use Deep Learning to Classify Business Photos at Yelp》
  • http://engineeringblog.yelp.com/2015/10/how-we-use-deep-learning-to-classify-business-photos-at-yelp.html

介绍:(Yelp)基于深度学习的商业图片分类.

  • 《Neural Networks and Deep Learning》
  • http://neuralnetworksanddeeplearning.com/

介绍:免费在线书《Neural Networks and Deep Learning》神经网络与深度学习。目前提供了前四章的草稿,第一章通过手写数字识别的例子介绍NN,第二章讲反向传播算法,第三章讲反向传播算法的优化,第四章讲NN为什么能拟合任意函数。大量python代码例子和交互动画,生动有趣.中文版

  • 《Books to Read if You Might Be Interested in Data Science》
  • http://www.datasciguide.com/books-to-read-if-you-might-be-interested-in-data-science/

介绍:数据科学大咖荐书(入门).

  • 《Deep Learning for NLP resources》
  • https://github.com/andrewt3000/DL4NLP

介绍:NLP 深度学习资源列表.

  • 《GitXiv》
  • http://gitxiv.com/

介绍:很多arXiv上面知名论文可以在这个网站找到github的项目链接.

  • 《Learning Multi-Domain Convolutional Neural Networks for Visual Tracking》
  • http://arxiv.org/pdf/1510.07945v1.pdf

介绍:深度学习在视觉跟踪的探索.

  • 《Beginners Guide: Apache Spark Machine Learning Scenario With A Large Input Dataset》
  • http://fullstackml.com/2015/10/29/beginners-guide-apache-spark-machine-learning-scenario-with-a-large-input-dataset/

介绍:Spark机器学习入门实例——大数据集(30+g)二分类.

  • 《Semantic Scholar》
  • https://www.semanticscholar.org/

介绍:保罗艾伦人工智能实验室表示,Google Scholar是十年前的产物,他们现在想要做进一步的提高。于是推出了全新的,专门针对科学家设计的学术搜索引擎Semantic Scholar.

  • 《Semi-Supervised Learning》
  • http://www.acad.bg/ebook/ml/MITPress-%20SemiSupervised%20Learning.pdf

介绍:半监督学习,Chapelle.篇篇都是经典,作者包括Vapnik,Bengio,Lafferty,Jordan.此外推荐Xiaojin (Jerry) Zhu编写的Introduction to Semi-Supervised Learning.

介绍:Spark机器学习入门实例——大数据集(30+g)二分类.

  • 《Free Resources for Beginners on Deep Learning and Neural Network》
  • http://www.analyticsvidhya.com/blog/2015/11/free-resources-beginners-deep-learning-neural-network/

介绍:为入门者准备的深度学习与神经网络免费资源.

  • 《TensorFlow is an Open Source Software Library for Machine Intelligence》
  • http://tensorflow.org/

介绍:Google 开源最新机器学习系统 TensorFlow,此外提供TensorFlow白皮书white paper of tensorflow 2015.hacker news,Google大牛解读TensorFlow

  • 《Veles:Distributed machine learning platform》
  • https://github.com/samsung/veles

介绍:三星开源的快速深度学习应用程序开发分布式平台.

  • 《DMTK:Microsoft Distributed Machine Learning Tookit 》
  • https://github.com/Microsoft/DMTK

介绍:分布式机器学习工具包.

  • 《Semantics Approach to Big Data and Event Processing》
  • http://wiki.knoesis.org/index.php/BigDataTutorial

介绍:语义大数据——大数据/事件处理的语义方法.

  • 《LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程》
  • http://www.zhihu.com/question/29411132

介绍:LSTM(Long Short Term Memory)和RNN(Recurrent)学习教程.

  • 《Marvin:A minimalist GPU-only N-dimensional ConvNet framework》
  • http://marvin.is/

介绍:Princeton Vision Group的深度学习库开源.

  • 《Ufora is a compiled, automatically parallel subset of python for data science and numerical computing》
  • http://ufora.github.io/ufora/

介绍:基于AWS的自动分布式科学计算库Ufora,Why I Open Sourced Five Years of Work.

  • 《Deep Learning and Deep Data Science - PyCon SE 2015》
  • https://www.youtube.com/watch?v=wBKfGaakFp8&hd=1

介绍:(PyCon SE 2015)深度学习与深度数据科学.

  • 《Zhi-Hua Zhou Papers》
  • https://scholar.google.com/citations?user=rSVIHasAAAAJ&hl=zh-CN&oi=ao

介绍:推荐南京大学机器学习与数据挖掘研究所所长——周志华教授的Google学术主页.

  • 《Advanced Linear Models for Data Science》
  • https://leanpub.com/lm

介绍:免费书:面向数据科学的高级线性模型.

  • 《Net2Net: Accelerating Learning via Knowledge Transfer》
  • http://arxiv.org/abs/1511.05641

介绍:基于知识迁移的神经网络高效训练Net2Net.

  • 《徐亦达机器学习课程 Variational Inference》
  • https://www.youtube.com/playlist?list=PLFze15KrfxbF0n1zTNoFIaDpxnSyfgNgc

介绍:徐亦达机器学习课程 Variational Inference.

  • 《Learning the Architecture of Deep Neural Networks》
  • http://arxiv.org/abs/1511.05497v1

介绍:深度神经网络结构学习.

  • 《Multimodal Deep Learning》
  • http://ai.stanford.edu/~ang/papers/icml11-MultimodalDeepLearning.pdf

介绍:来自斯坦福大学的Multimodal Deep Learning papers.

  • 《深度学习简析,TensorFlow,Torch,Theano,Mxnet》
  • http://chiffon.gitcafe.io/2015/11/16/long.html

介绍:深度学习简析,TensorFlow,Torch,Theano,Mxnet.

  • 《"Notes Essays —CS183C: Technology-enabled Blitzscaling — Stanford University》
  • https://medium.com/notes-essays-cs183c-technology-enabled-blitzscalin/latest

介绍:这个专栏是一个stanford学生做的CS183c课程的一个note,该课程是由Reid Hoffman等互联网boss级人物开设的,每节课请一位巨头公司的相关负责人来做访谈,讲述该公司是怎么scale的。最新两期分别请到了雅虎的梅姐和airbnb创始人Brian Chesky。.

  • 《Natural Language Understanding with Distributed Representation》
  • https://github.com/nyu-dl/NLP_DL_Lecture_Note

介绍:基于分布式表示的自然语言理解(100+页),论文.

  • 《Recommender Systems Handbook》
  • http://link.springer.com/book/10.1007/978-1-4899-7637-6

介绍:推荐系统手册.

  • 《Understanding LSTM Networks》
  • http://colah.github.io/posts/2015-08-Understanding-LSTMs/index.html

介绍:理解LSTM网络翻译.

  • 《Machine Learning at Quora》
  • https://www.linkedin.com/pulse/machine-learning-quora-xavier-amatriain

介绍:机器学习在quora中的应用.

  • 《On Learning to Think: Algorithmic Information Theory for Novel Combinations of Reinforcement Learning Controllers and Recurrent Neural World Models》
  • http://arxiv.org/abs/1511.09249

介绍:思维学习——RL+RNN算法信息论.

  • 《The 5 Ways Data Scientists Keep Learning After College》
  • https://blog.rjmetrics.com/2015/12/01/the-5-ways-data-scientists-keep-learning-after-college/

介绍:数据科学家毕业后继续学习的5种方式.

  • 《Deep Learning in Neural Networks: An Overview》
  • http://arxiv.org/abs/1404.7828

介绍:深度学习在神经网络的应用.

  • 《Contextual Learning》
  • http://arxiv.org/abs/1511.06429

介绍:上下文学习,代码.

  • 《Machine Learning For Complete Beginners》
  • http://pythonforengineers.com/machine-learning-for-complete-beginners/

介绍:机器学习零基础入门,代码.

  • 《2015年中国计算机学会(CCF)优秀博士学位论文》
  • http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2897719129810

介绍:2015年度CCF优秀博士学位论文奖论文列表.

  • 《Learning to Hash Paper, Code and Dataset》
  • http://cs.nju.edu.cn/lwj/L2H.html

介绍:Learning to Hash Paper, Code and Dataset.

  • 《Neural networks with Theano and Lasagne》
  • https://www.youtube.com/watch?v=dtGhSE1PFh0

介绍:(PyData2015)基于Theano/Lasagne的CNN/RNN教程,github.

  • 《神经网络与深度学习讲义》
  • http://vdisk.weibo.com/s/ayG13we2ltDAT

介绍:复旦大学邱锡鹏老师编写的神经网络与深度学习讲义,ppt.

  • 《Microsoft Open Sources Distributed Machine Learning Toolkit》
  • http://www.dmtk.io/index.html

介绍:微软亚洲研究院开源分布式机器学习工具包.

  • 《语音识别的技术原理是什么?》
  • https://www.zhihu.com/question/20398418

介绍:语音识别的技术原理浅析

  • 《Michael I. Jordan》
  • http://www.cs.berkeley.edu/~jordan/

介绍:迈克尔·I.乔丹的主页.根据主页可以找到很多资源。迈克尔·I.乔丹是知名的计算机科学和统计学学者,主要研究机器学习和人工智能。他的重要贡献包括指出了机器学习与统计学之间的联系,并推动机器学习界广泛认识到贝叶斯网络的重要性。

  • 《Geoff Hinton》
  • http://www.cs.toronto.edu/~hinton/

介绍:杰弗里·埃弗里斯特·辛顿 FRS是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者.通过他的主页可以发掘到很多Paper以及优秀学生的paper,此外推荐他的学生Yann Lecun主页

  • 《Yoshua Bengio》
  • http://www.iro.umontreal.ca/~bengioy/yoshua_en/index.html

介绍:Yoshua Bengio是机器学习方向的牛人,如果你不知道可以阅读对话机器学习大神Yoshua Bengio(上),对话机器学习大神Yoshua Bengio(下)

  • 《Large Scale Deep Learning within google》
  • http://static.googleusercontent.com/media/research.google.com/en/us/people/jeff/CIKM-keynote-Nov2014.pdf

介绍:google大规模深度学习应用演进

  • 《Deep Learning: An MIT Press Book in Preparation》
  • http://goodfeli.github.io/dlbook/

介绍:MIT出版的深度学习电子书,公开电子书

  • 《A Mathematical Theory of Deep Convolutional Neural Networks for Feature Extraction》
  • http://arxiv.org/abs/1512.06293

介绍:深度卷积神经网络(CNN)提取特征的数学理论

  • 《Microsoft Research Asia:Kaiming He》
  • http://research.microsoft.com/en-us/um/people/kahe/

介绍:推荐微软亚洲研究院何恺明主页

  • 《Speech and Language Processing (3rd ed. draft)》
  • http://web.stanford.edu/~jurafsky/slp3/

介绍:《语音与语言处理》第三版(草稿)

  • 《LSA 311: Computational Lexical Semantics - Summer 2015》
  • http://web.stanford.edu/~jurafsky/li15/

介绍:Stanford新课"计算词汇语义学"

  • 《上海交大张志华老师的统计机器学习与机器学习导论视频》
  • http://ocw.sjtu.edu.cn/G2S/OCW/cn/CourseDetails.htm?Id=397

介绍:上海交大张志华老师的统计机器学习与机器学习导论视频链接:密码: r9ak .概率基础

  • 《Computational Linguistics and Deep Learning》
  • http://www.mitpressjournals.org/doi/pdf/10.1162/COLI_a_00239

介绍:computational linguistics and deep learning视频,推荐Deep Learning: An Introduction from the NLP Perspective

  • 《Black Hat USA 2015 - Deep Learning On Disassembly》
  • https://www.youtube.com/watch?v=zfVfpMcUkq8

介绍:(BlackHat2015)深度学习应用之流量鉴别(协议鉴别/异常检测),[slide])(https://www.blackhat.com/docs/us-15/materials/us-15-Wang-The-Applications-Of-Deep-Learning-On-Traffic-Identification.pdf),material

  • 《LibRec:A Java Library for Recommender Systems》
  • http://www.librec.net/

介绍:一个推荐系统的Java库

  • 《Multi-centrality Graph Spectral Decompositions and their Application to Cyber Intrusion Detection》
  • http://arxiv.org/abs/1512.07372

介绍:多中心图的谱分解及其在网络入侵检测中的应用(MC-GPCA&MC-GDL)

  • 《Computational Statistics in Python》
  • http://people.duke.edu/~ccc14/sta-663/

介绍:用Python学计算统计学

  • 《New open-source Machine Learning Framework written in Java》
  • http://blog.datumbox.com/new-open-source-machine-learning-framework-written-in-java/

介绍:datumbox-framework——Java的开源机器学习框架,该框架重点是提供大量的机器学习算法和统计检验,并能够处理中小规模的数据集

  • 《Awesome Recurrent Neural Networks》
  • http://jiwonkim.org/awesome-rnn/

介绍:递归神经网络awesome系列,涵盖了书籍,项目,paper等

  • 《Pedro Domingos》
  • http://homes.cs.washington.edu/~pedrod/

介绍:Pedro Domingos是华盛顿大学的教授,主要研究方向是机器学习与数据挖掘.在2015年的ACM webinar会议,曾发表了关于盘点机器学习领域的五大流派主题演讲.他的个人主页拥有很多相关研究的paper以及他的教授课程.

  • 《Video resources for machine learning》
  • http://dustintran.com/blog/video-resources-for-machine-learning/

介绍:机器学习视频集锦

  • 《Deep Machine Learning libraries and frameworks》
  • https://medium.com/@abduljaleel/deep-machine-learning-libraries-and-frameworks-5fdf2bb6bfbe#.lwn2iyjsn

介绍:深度机器学习库与框架

  • 《大数据/数据挖掘/推荐系统/机器学习相关资源》
  • https://github.com/Flowerowl/Big-Data-Resources

介绍:这篇文章内的推荐系统资源很丰富,作者很有心,摘录了《推荐系统实战》内引用的论文.

  • 《Bayesian Methods in Astronomy: Hands-on Statistics》
  • http://nbviewer.ipython.org/github/jakevdp/AAS227Workshop/blob/master/Index.ipynb

介绍:(天文学)贝叶斯方法/MCMC教程——统计实战

  • 《Statistical Learning with Sparsity: The Lasso and Generalizations》
  • http://web.stanford.edu/~hastie/StatLearnSparsity/index.html

介绍:免费书:统计稀疏学习,作者Trevor Hastie与Rob Tibshirani都是斯坦福大学的教授,Trevor Hastie更是在统计学学习上建树很多

  • 《The Evolution of Distributed Programming in R》
  • http://www.mango-solutions.com/wp/2016/01/the-evolution-of-distributed-programming-in-r/

介绍:R分布式计算的进化,此外推荐(R)气候变化可视化,(R)马尔可夫链入门

  • 《neon workshop at Startup.ML: Sentiment Analysis and Deep Reinforcement Learning》
  • http://www.nervanasys.com/neon-workshop-at-startup-ml-sentiment-analysis-and-deep-reinforcement-learning/

介绍:Nervana Systems在Startup.ML的主题研讨会——情感分析与深度强化学习

  • 《Understanding Convolution in Deep Learning》
  • http://timdettmers.com/2015/03/26/convolution-deep-learning/

介绍:深度学习卷积概念详解.

  • 《Python libraries for building recommender systems》
  • http://faroba.com/2015/12/03/a-python-libraries-for-building-recommender-systems/

介绍:Python推荐系统开发库汇总.

  • 《Neural networks class - Université de Sherbrooke》
  • http://info.usherbrooke.ca/hlarochelle/neural_networks/content.html

介绍:超棒的神经网络课程,深入浅出介绍深度学习,由Hugo Larochelle(Yoshua Bengio的博士生,Geoffrey Hinton之前的博士后)主讲,强烈推荐.

  • 《CS231n: Convolutional Neural Networks for Visual Recognition》
  • http://vision.stanford.edu/teaching/cs231n/index.html

介绍:斯坦福新课程,面向视觉识别的卷积神经网络(Fei-Fei Li & Andrej Karpathy),slides+video,homework.

  • 《NIPS 2015 Deep Learning Symposium Part I》
  • http://yanran.li/peppypapers/2015/12/11/nips-2015-deep-learning-symposium-part-i.html

介绍:NIPS 2015会议总结第一部分,第二部分.

  • 《python机器学习入门资料梳理》
  • http://michaelxiang.me/2015/12/16/python-machine-learning-list/

介绍:python机器学习入门资料梳理.

  • 《Reading Text in the Wild with Convolutional Neural Networks》
  • http://www.robots.ox.ac.uk/~vgg/publications/2016/Jaderberg16/

介绍:牛津大学著名视觉几何组VGG在IJCV16年首卷首期: Reading Text in the Wild with Convolutional Neural Networks,Jaderberg。这篇期刊文章融合了之前两篇会议(ECCV14,NIPS14ws),定位和识别图片中的文本(叫text spotting)。 端到端系统: 检测Region + 识别CNN。论文、数据和代码.

  • 《Yet Another Computer Vision Index To Datasets (YACVID)》
  • http://riemenschneider.hayko.at/vision/dataset/

介绍:计算机视觉的一个较大的数据集索引, 包含387个标签,共收录了314个数据集合,点击标签云就可以找到自己需要的库了.

  • 《Why SLAM Matters, The Future of Real-Time SLAM, and Deep Learning vs SLAM》
  • http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html

介绍:Tombone 对 ICCV SLAM workshop 的总结: the future of SLAM, SLAM vs deep learning 重点介绍了 monoSLAM 和 LSD-SLAM,而且讨论了 feature-based 和 feature-free method 的长短。在全民deep learning做visual perception的时候,再来读读CV中的 geometry.

  • 《Python based Deep Learning Framework by Nervana™》
  • https://github.com/NervanaSystems/neon

介绍:Nervana Systems的开源深度学习框架neon发布.

  • 《mageNet and MS COCO Visual Recognition Challenges video and slider》
  • http://image-net.org/challenges/ilsvrc+mscoco2015

介绍:ICCV 2015的ImageNet比赛以及MS COCO竞赛联合研讨会的幻灯片和视频.

  • 《An Introduction to Machine Learning with Python》
  • http://blog.districtdatalabs.com/an-introduction-to-machine-learning-with-python

介绍:Python机器学习入门.

  • 《Neural Enquirer: Learning to Query Tables with Natural Language》
  • http://arxiv.org/abs/1512.00965

介绍:Neural Enquirer 第二版.

  • 《Deep Learning - Taking machine learning to the next level》
  • https://www.udacity.com/course/deep-learning--ud730

介绍:[Google]基于TensorFlow的深度学习/机器学习课程.

  • 《100 “must read” R-bloggers’ posts for 2015》
  • http://www.r-bloggers.com/100-must-read-r-bloggers-posts-for-2015/

介绍:R-bloggers网站2015"必读"的100篇文章,R语言学习的福音.

  • 《Machine Learning: a Probabilistic Perspective》
  • http://www.cs.ubc.ca/~murphyk/MLbook/index.html

介绍:推荐书籍:<机器学习:概率视角>,样章Undirected graphical models Markov random fields.

  • 《Deep learning Book》
  • http://www.deeplearningbook.org/

介绍:这是一本在线的深度学习书籍,合著者有Ian Goodfellow, Yoshua Bengio 和 Aaron Courville.如果你是一位新入门的学员可以先看这本书籍Yoshua Bengio: How can one get started with machine learning?.中文译本

  • 《UFLDL Recommended Readings》
  • http://ufldl.stanford.edu/wiki/index.php/UFLDL_Recommended_Readings

介绍:UFLDL推荐的深度学习阅读列表.

  • 《CSE 705: Deep Learning (Spring 2015)》
  • http://www.cse.buffalo.edu/~hungngo/classes/2015/705/

介绍:纽约州立大学布法罗分校2015年春季机器学习课程主页.

  • 《Theano is a Deep learning Python library 》
  • https://github.com/Theano/Theano

介绍: Theano是主流的深度学习Python库之一,亦支持GPU,入门比较难.推荐Theano tutorial,Document

  • 《Statistical Language Models Based On Neural Networks》
  • http://www.fit.vutbr.cz/~imikolov/rnnlm/thesis.pdf

介绍:博士论文:神经网络统计语言模型.

  • 《文本数据的机器学习自动分类方法(上)》
  • http://www.infoq.com/cn/articles/machine-learning-automatic-classification-of-text-data

介绍:文本数据的机器学习自动分类方法(下).

  • 《Pixel Recurrent Neural Networks》
  • http://arxiv.org/abs/1601.06759

介绍:用RNN预测像素,可以把被遮挡的图片补充完整.

  • 《Computational Network Toolkit (CNTK)》
  • https://github.com/Microsoft/CNTK

介绍:微软研究院把其深度学习工具包CNTK,想进一步了解和学习CNTK的同学可以看前几天公布的《CNTK白皮书》An Introduction to Computational Networks and the Computational Network Toolkit.

  • 《Kalman and Bayesian Filters in Python》
  • https://github.com/rlabbe/Kalman-and-Bayesian-Filters-in-Python

介绍: 卡尔曼滤波器教材,用尽量少的数学和推导,传授直觉和经验,全部Python示例,内容覆盖卡尔曼滤波器、扩展卡尔曼滤波,无迹卡尔曼滤波等,包括练习和参考答案

  • 《Statistical inference for data science》
  • https://leanpub.com/LittleInferenceBook

介绍:在线免费书:面向数据科学的统计推断,R示例代码,很不错GitHub.

  • 《Learning Deep Architectures for AI》
  • http://www.iro.umontreal.ca/~bengioy/papers/ftml_book.pdf

介绍:这本书是由Yoshua Bengio撰写的教程,其内容包含了学习人工智能所使用的深度学习架构的学习资源,书中的项目已停止更新DeepLearnToolbox.

  • 《Machine Learning Tutorials》
  • https://github.com/ujjwalkarn/Machine-Learning-Tutorials

介绍:这是一份机器学习和深度学习教程,文章和资源的清单。这张清单根据各个主题进行撰写,包括了许多与深度学习有关的类别、计算机视觉、加强学习以及各种架构.

  • 《Data science ipython notebooks》
  • https://github.com/donnemartin/data-science-ipython-notebooks

介绍:这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习,像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中,当然还有相关的特定构架和概念等.

  • 《Open Source Deep Learning Server》
  • http://www.deepdetect.com/

介绍:开源的深度学习服务,DeepDetect是C++实现的基于外部机器学习/深度学习库(目前是Caffe)的API。给出了图片训练(ILSVRC)和文本训练(基于字的情感分析,NIPS15)的样例,以及根据图片标签索引到ElasticSearch中github.

  • 《Data Mining, Analytics, Big Data, and Data Science》
  • http://www.kdnuggets.com/

介绍:这是国外的一个科技频道,涵盖了数据挖掘,分析以及数据科学类的文章.偶尔还有机器学习精选.

  • 《Data Mining And Statistics: What's The Connection?》
  • http://docs.salford-systems.com/dm-stat.pdf

介绍:经典论文:数据挖掘与统计学.

  • 《(NIPS’2015 Tutorial)Yoshua Bengio深度学习》
  • https://drive.google.com/file/d/0BxKBnD5y2M8NVnBpbWVwYUpQTjg/view

介绍:NIPS’2015 Tutorial by Yoshua Bengio.

  • 《(NENO:Python based Deep Learning Framework》
  • https://github.com/NervanaSystems/neon

介绍:Nervana Systems的开源深度学习框架neon发布.

  • 《(Matt Might:Reading for graduate students》
  • http://matt.might.net/articles/books-papers-materials-for-graduate-students/

介绍:犹他州大学Matt Might教授推荐的研究生阅读清单.

  • 《Awesome Public Datasets》
  • https://github.com/caesar0301/awesome-public-datasets

介绍:开放数据集.

  • 《Introduction to Probability - The Science of Uncertainty》
  • https://www.edx.org/course/introduction-probability-science-mitx-6-041x-1

介绍:(edX)不确定性的科学——概率论导论(MITx).

  • 《R software and tools for everyday use》
  • http://xrds.acm.org/blog/2016/02/r-software-and-tools-for-everyday-use/

介绍:R语言开发常用软件/工具推荐.

  • 《Implementing Dynamic memory networks》
  • http://yerevann.github.io//2016/02/05/implementing-dynamic-memory-networks/

介绍:动态记忆网络实现.

  • 《Deeplearning4j 中文主页》
  • http://deeplearning4j.org/zh-index.html/

介绍:英文主页

  • 《Big Data Analysis Learning Resources: 50 Courses, Blogs, Tutorials, And More For Mastering Big Data Analytics》
  • http://www.ngdata.com/big-data-analysis-resources/

介绍:50个大数据分析最佳学习资源(课程、博客、教程等)

  • 《A Full Hardware Guide to Deep Learning》
  • http://timdettmers.com/2015/03/09/deep-learning-hardware-guide/

介绍:深度学习的全面硬件指南,从GPU到RAM、CPU、SSD、PCIe,译文

  • 《Deep Residual Networks》
  • https://github.com/KaimingHe/deep-residual-networks

介绍:kaiming开源作品

  • 《The Definitive Guide to Natural Language Processing》
  • https://blog.monkeylearn.com/the-definitive-guide-to-natural-language-processing/

介绍:自然语言处理(NLP)权威指南

  • 《Evaluating language identification performance》
  • https://blog.twitter.com/2015/evaluating-language-identification-performance

介绍:如何在社会媒体上做语言检测?没有数据怎么办?推特官方公布了一个十分难得的数据集:12万标注过的Tweets,有70种语言

  • 《ICLR 2016 Accepted Papers》
  • http://www.iclr.cc/doku.php?id=iclr2016:main&#accepted_papers_conference_track

介绍:深度学习和机器学习重要会议ICLR 2016录取文章

  • 《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》
  • http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide/

介绍:机器学习——深度非技术指南

  • 《Data Storytelling 101: Helpful Tools for Gathering Ideas, Designing Content & More》
  • http://blog.hubspot.com/marketing/toolbox-for-data-storytelling

介绍:数据叙事入门指南——创意生成/数据采集/内容设计相关资源推荐

  • 《WikiTableQuestions: a Complex Real-World Question Understanding Dataset》
  • http://nlp.stanford.edu/blog/wikitablequestions-a-complex-real-world-question-understanding-dataset/

介绍:WikiTableQuestions——复杂真实问答数据集

  • 《Big Data: 35 Brilliant And Free Data Sources For 2016》
  • http://www.forbes.com/sites/bernardmarr/2016/02/12/big-data-35-brilliant-and-free-data-sources-for-2016/#64ede4f16796

介绍:(2016版)35个超棒的免费大数据源

  • 《SPARKNET: training deep networks in spark》
  • http://arxiv.org/pdf/1511.06051v3.pdf

介绍:Ion Stoica和 Michael I. Jordan两位大家首次联手发文,CAFFE和SPARK完美结合,分布式深度学习混搭模式!github

  • 《DeepLearning.University – An Annotated Deep Learning Bibliography | Memkite》
  • http://memkite.com/deep-learning-bibliography/

介绍:深度学习(分类)文献集

  • 《Learning Deep Learning》
  • http://rt.dgyblog.com/ref/ref-learning-deep-learning.html

介绍:深度学习阅读列表

  • 《Awesome42 The easiest way to find R packages》
  • http://awesome42.com/

介绍:探索R包的好网站Awesome 42

  • 《MLbase:Distributed Machine Learning Made Easy》
  • http://mlbase.org/

介绍:MLbase是Prof. Dr. Tim Kraska的一个研究项目,MLbase是一个分布式机器学习管理系统

  • 《Deep Learning At Scale and At Ease》
  • http://www.comp.nus.edu.sg/~ooibc/singa-tomm.pdf

介绍:分布式深度学习平台SINGA介绍

  • 《Learn All About Apache Spark (100x Faster than Hadoop MapReduce)》
  • http://datasciencereport.com/2016/02/19/apache-spark/

介绍:Spark视频集锦

  • 《R For Deep Learning (I): Build Fully Connected Neural Network From Scratch》
  • http://www.parallelr.com/r-deep-neural-network-from-scratch/

介绍:R语言深度学习第一节:从零开始

  • 《A Visual Introduction to Machine Learning》
  • http://www.r2d3.us/visual-intro-to-machine-learning-part-1/

介绍:图解机器学习

  • 《Citation Network Dataset》
  • http://aminer.org/citation

介绍:AMiner论文引用数据集(v7:2,244,021 papers and 4,354,534 citation relationships)

  • 《Best Free Machine Learning Ebooks》
  • https://www.reddit.com/r/MachineLearning/comments/47ast8/best_free_machine_learning_ebooks/

介绍:10本最佳机器学习免费书

  • 《International Conference on Computer Vision (ICCV) 2015, Santiago》
  • http://videolectures.net/iccv2015_santiago/

介绍:ICCV15视频集

  • 《CaffeOnSpark Open Sourced for Distributed Deep Learning on Big Data Clusters》
  • https://github.com/yahoo/CaffeOnSpark

介绍::(Yahoo)基于Hadoop/Spark的分布式Caffe实现CaffeOnSpark

  • 《A Short Introduction to Learning to Rank》
  • http://research.microsoft.com/en-us/people/hangli/l2r.pdf

介绍:Learning to Rank简介

  • 《Global Deep learning researcher》
  • https://aminer.org/search/t=b&q=Deep%20Learning

介绍:全球深度学习专家列表,涵盖研究者主页

  • 《Top Spark Ecosystem Projects》
  • http://www.kdnuggets.com/2016/03/top-spark-ecosystem-projects.html

介绍:Spark生态顶级项目汇总

  • 《Proceedings of the 21st International Conference on Intelligent User Interfaces》
  • http://dl.acm.org/citation.cfm?id=2856767&preflayout=flat

介绍:ACM IUI'16论文集Conference Navigator - Proceedings

  • 《Machine Learning: An In-Depth, Non-Technical Guide - Part 1》
  • http://www.innoarchitech.com/machine-learning-an-in-depth-non-technical-guide/

介绍:深入机器学习,2,3,4

  • 《Oxford Deep Learning》
  • http://www.computervisiontalks.com/tag/deep-learning-course/

介绍:Nando de Freitas在 Oxford 开设的深度学习课程,课程youtube地址,Google DeepMind的研究科学家,此外首页:computervisiontalks的内容也很丰富,如果你是做机器视觉方面的研究,推荐也看看其他内容.肯定收获也不小.还有,这位youtube主页顶过的视频也很有份量

  • 《Neural Networks for Machine Learning》
  • https://www.coursera.org/course/neuralnets

介绍:Geoffrey Hinton在Coursera开设的MOOC

  • 《Deep Learning News》
  • http://news.startup.ml/

介绍:深度学习领域的Hacker news.紧跟深度学习的新闻、研究进展和相关的创业项目。从事机器学习,深度学习领域的朋友建议每天看一看

  • 《Maxout Networks》
  • http://jmlr.org/proceedings/papers/v28/goodfellow13.pdf

介绍:Maxout网络剖析

  • 《Advances in Neural Information Processing Systems》
  • http://papers.nips.cc/

介绍:NIPS领域的会议paper集锦

  • 《Machine learning applications in genetics and genomics》
  • http://www.nature.com/nrg/journal/v16/n6/abs/nrg3920.html

介绍:机器学习在生物工程领域的应用,如果你从事生物工程领域,可以先阅读一篇文章详细介绍

  • 《Deep Learning in Bioinformatics》
  • http://arxiv.org/abs/1603.06430

介绍:深度学习在生物信息学领域的应用

  • 《A Few Useful Things to Know about Machine Learning》
  • https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf

介绍:一些关于机器学习需要知道知识,对于刚刚入门机器学习的同学应该读一读

  • 《Cambridge Machine Learning Group》
  • http://mlg.eng.cam.ac.uk/

介绍:剑桥大学机器学习用户组主页,网罗了剑桥大学一些机器学习领域专家与新闻

  • 《Randy Olson's data analysis and machine learning projects》
  • https://github.com/rhiever/Data-Analysis-and-Machine-Learning-Projects

介绍:Randy Olson's的一些数据分析与机器学习项目库,是学习实践的好材料

  • 《GoLearn:Golang machine learning library》
  • https://github.com/sjwhitworth/golearn

介绍:Golang机器学习库,简单,易扩展

  • 《Swift Ai》
  • https://github.com/collinhundley/Swift-AI

介绍:用Swift开发苹果应用的倒是很多,而用来做机器学习的就比较少了.Swift Ai在这方面做了很多聚集.可以看看

  • 《Please explain Support Vector Machines (SVM) like I am a 5 year old》
  • https://www.reddit.com/r/MachineLearning/comments/15zrpp/please_explain_support_vector_machines_svm_like_i/

介绍:如何向一位5岁的小朋友解释支持向量机(SVM)

  • 《reddit Machine learning》
  • https://www.reddit.com/r/MachineLearning/

介绍: reddit的机器学习栏目

  • 《ComputerVision resource》
  • http://blog.csdn.net/carson2005/article/details/6601109

介绍: 计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接.做计算机视觉方向的朋友建议多关注里面的资源

  • 《Multimedia Laboratory Homepage》
  • http://mmlab.ie.cuhk.edu.hk/index.html

介绍:香港中文大学深度学习研究主页,此外研究小组对2013年deep learning 的最新进展和相关论文做了整理,其中useful links的内容很受益

  • 《Search Engines that Learn from Their Users》
  • http://www.anneschuth.nl/wp-content/uploads/thesis_anne-schuth_search-engines-that-learn-from-their-users.pdf

介绍: 这是一篇关于搜索引擎的博士论文,对现在普遍使用的搜索引擎google,bing等做了分析.对于做搜索类产品的很有技术参考价值

  • 《Deep Learning Books》
  • http://machinelearningmastery.com/deep-learning-books/

介绍: 深度学习书籍推荐(毕竟这类书比较少).

  • 《Towards Bayesian Deep Learning: A Survey》
  • http://arxiv.org/abs/1604.01662

介绍: 贝叶斯定理在深度学习方面的研究论文.

  • 《Revisiting Distributed Synchronous SGD》
  • http://arxiv.org/abs/1604.00981

介绍: 来自谷歌大脑的重温分布式梯度下降.同时推荐大规模分布式深度网络

  • 《Research Issues in Social Computing》
  • http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.102.6931&rep=rep1&type=pdf

介绍: 社交计算研究相关问题综述.

  • 《What are some important areas of research in social computing right now?》
  • https://www.quora.com/What-are-some-important-areas-of-research-in-social-computing-right-now

介绍: 社交计算应用领域概览,里面有些经典论文推荐

  • 《Collaborative Filtering Recommender Systems》
  • http://files.grouplens.org/papers/FnT%20CF%20Recsys%20Survey.pdf

介绍: 协同过滤在推荐系统应用.

  • 《Content-Boosted Collaborative Filtering for Improved Recommendations》
  • http://www.cs.utexas.edu/~ml/papers/cbcf-aaai-02.pdf

介绍: 协同过滤在内容推荐的研究.

  • 《Unifying User-based and Item-based Collaborative Filtering Approaches by Similarity Fusion》
  • http://siplab.tudelft.nl/sites/default/files/sigir06_similarityfusion.pdf

介绍: 协同过滤经典论文.

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2017-10-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

简简单单,用 LSTM 创造一个写诗机器人

AI 研习社:人们已经给神经网络找到了越来越多的事情做,比如画画和写诗,微软的小冰都已经出版了一本诗集了。而其实训练一个能写诗的神经网络并不难,Automatt...

37313
来自专栏专知

【NAACL2018最佳论文】忘掉Word2vec吧!艾伦人工智能研究院新词向量学习方法,一文了解各大奖项论文

【导读】当地时间6月1日到6月6日,第十六届自然语言处理顶级会议NAACL - HLT(Annual Conference of the North Ameri...

1043
来自专栏AI2ML人工智能to机器学习

概率估值的光滑(Smoothing)

一般通过频率(Frequency / Counting)来估值的过程中,存在需要光滑(Smoothing)的问题, 这个问题在自然语言处理或者贝叶斯算法中尤为突...

4072
来自专栏机器之心

解读 | 替代图灵测试?让人工智能参加数学和科学考试

SyncedReview 作者:Shixin Gu 参与:Joshua Chou、Chain Zhang、熊猫 图灵测试在过去很长一段时间里都被认为是一种衡量人...

42312
来自专栏人工智能LeadAI

《机器学习基石》课程学习总结(一)

《机器学习基石》课程非常棒,作为总结,本文重点是梳理课程中的知识脉络,同时尽可能说白话,让没有机器学习背景的朋友也能看懂。 这个课程好在哪里? 1、最大的好 课...

4615
来自专栏机器学习算法与Python学习

机器学习正在成为程序员的必备能力

1304
来自专栏专知

【业界】 | 谷歌 NIPS 2017 23篇论文:从注意力到价值预测网络(附论文下载)

【导读】2017年度神经信息处理系统大会(NIPS 2017)将于12 月份在美国长滩举行,本届NIPS共收到 3240 篇论文投稿,录用 678 篇,录用率为...

37310
来自专栏个人分享

最大熵的Java实现

这是一个最大熵的简明Java实现,提供训练与预测接口。训练采用GIS训练算法,附带示例训练集。本文旨在介绍最大熵的原理、分类和实现,不涉及公式推导或其他训练算法...

1913
来自专栏专知

【干货】理解特征工程Part 1——连续数值数据(附代码)

8761
来自专栏量子位

超级变变变:喵星人汪星人还有街景神奇变身 | Paper+Code

夏乙 千平 发自猴姆 量子位 出品 | 公众号 QbitAI 只会卖萌的猫主子分分钟变身百兽之王? 白天能不能懂夜的黑? 你的汪星人如果是其他品种会是什么样? ...

4458

扫码关注云+社区

领取腾讯云代金券