首页
学习
活动
专区
工具
TVP
发布

机器学习算法与Python学习

专栏作者
1142
文章
1307669
阅读量
186
订阅数
Python 奇淫技巧!
原文:https://medium.freecodecamp.org/an-a-z-of-useful-python-tricks-b467524ee747
昱良
2022-02-28
4590
PyTorch 1.9发布,这些更新值得关注!
不久之前,PyTorch 官方博客发布 1.8 版本,此版本由 1.7 发布以来的 3000 多个 commit 组成,重要更新内容包括在编译、代码优化和科学计算前端 API 方面的优化和改进,以及通过 pytorch.org 提供的二进制文件来支持 AMD ROCm。
昱良
2021-07-01
8570
PyTorch 1.7发布,支持CUDA 11、Windows分布式训练
昨日,PyTorch 团队发布 PyTorch 1.7 版本。该版本增添了很多新特性,如支持 CUDA 11、Windows 分布式训练、增加了支持快速傅里叶变换(FFT)的新型 API 等。
昱良
2020-11-03
6050
python爬虫,学习路径拆解及资源推荐
数据是决策的原材料,高质量的数据价值不菲,如何挖掘原材料成为互联网时代的先驱,掌握信息的源头,就能比别人更快一步。
昱良
2019-07-04
1.4K0
富士通 1.24min 训练ImageNet,刷新Google 1.8min记录!
Large mini-batch 分布式深度学习是满足需求的关键技术。但是由于难以在不影响准确性的情况下在大型集群上实现高可扩展性,因此具有较大的挑战难度。
昱良
2019-07-04
6290
字节跳动开源分布式训练框架BytePS,登上GitHub热榜
字节跳动开源了通用分布式训练框架BytePS,支持TensorFlow、Keras、PyTorch、MXNet,可以运行在TCP或RDMA网络中,大大优于现有的开源分布式训练框架。
昱良
2019-07-04
8970
机器学习类面试问题与思路总结,你需要吗?
机器学习、大数据相关岗位根据业务的不同,岗位职责大概分为: 1、平台搭建类  数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识; 2、算法研究类  - 文本挖掘,如领域知识图谱构建、垃圾短信过滤等;   - 推荐,广告推荐、APP 推荐、题目推荐、新闻推荐等;   - 排序,搜索结果排序、广告排序等;   - 广告投放效果分析;   - 互联网信用评价;   - 图像识别、理解。 3、数据挖掘类 - 商业智能,如统计报表;   - 用户体验分析,预测流失用户。   以上是根据求职季有限的接触所做的总结。有的应用方向比较成熟,业界有足够的技术积累,比如搜索、推荐,也有的方向还有很多开放性问题等待探索,比如互联网金融、互联网教育。在面试的过程中,一方面要尽力向企业展现自己的能力,另一方面也是在增进对行业发展现状与未来趋势的理解,特别是可以从一些刚起步的企业和团队那里,了解到一些有价值的一手问题。
昱良
2018-07-31
4230
周志华团队和蚂蚁金服合作:用分布式深度森林算法检测套现欺诈
源 | AI科技大本营 互联网公司每天都面临着处理大规模机器学习应用程序的问题,因此我们需要一个可以处理这种超大规模的日常任务的分布式系统。最近,以集成树为构建模块的深度森林(Deep Forest)算法被提出,并在各个领域取得了极具竞争力的效果。然而,这种算法的性能还未在超大规模的任务中得到测试。近日,基于蚂蚁金服的参数服务器系统“鲲鹏”及其人工智能平台“PAI”,蚂蚁金服和南京大学周志华教授的研究团队合作开发了一种分布式的深度森林算法,同时提供了一个易于使用的图形用户界面(GUI)。 为了满足现实世界
昱良
2018-06-25
8660
PyTorch 的这些更新,你都知道吗?
翻译 | 林椿眄 出品 | AI 科技大本营(公众号ID:rgznai100) 一些你可能不知道的优质公众号! 这次版本的主要更新一些性能的优化,包括权衡内存计算,提供 Windows 支持,24个基础分布,变量及数据类型,零维张量,张量变量合并,支持 CuDNN 7.1,加快分布式计算等,并修复部分重要 bug等。 ▌目录 主要变化 张量/变量合并 零维张量 数据类型 版本迁移指南 新特性 张量 高级的索引功能 快速傅里叶变换 神经网络 权衡内存计算 瓶颈—用于识别代码热点的工具 torch中的分布 2
昱良
2018-06-25
5.8K0
大规模机器学习框架的四重境界
源 | 分布式机器学习系统@知乎 文 | carbon zhang 整理 | AI时间 1.背景 本篇主要针对volume大的数据时,使用机器学习来进行数据处理过程中遇到的架构方面的问题做一个系统的梳理。 有了GFS我们有能力积累海量的数据样本,比如在线广告的曝光和点击数据,天然具有正负样本的特性,累积一两个月往往就能轻松获得百亿、千亿级的训练样本。这样海量的样本如何存储?用什么样的模型可以学习海量样本中有用的pattern?这些问题不止是工程问题,也值得每个做算法的同学去深入思考。 1.1 简
昱良
2018-06-25
8480
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档