首页
学习
活动
专区
工具
TVP
发布

机器学习算法与Python学习

专栏成员
1142
文章
1385543
阅读量
187
订阅数
掌握BERT、GPT-3、图神经网络、知识图谱等大厂必备技能!
金三银四很快就到了,铁子们做好跳槽拿高薪的准备了吗? 回想去年的算法岗,可谓是从灰飞烟灭到人间炼狱。之后的趋势都变成了这样:转行的开始转行,换专业的开始换专业。 于是很多人欲转行NLP,原因是NLP技术近几年发展非常快,像BERT、GPT-3、图神经网络、知识图谱等技术被大量应用于项目实践中,这也推动了NLP在产业中的持续落地,以及行业对相关人才的需求。  但是最近有粉丝私信我,NLP很难学,这条路能坚持走吗? 对于这位朋友的问题,我想从两方面开始回答。 NLP学起来不容易 01 很多大多数欲从事N
昱良
2022-03-04
5190
【Colab Notebooks】6个小技巧,屡试不爽!
切换暗黑模式、读取 CSV 文件… 这些非常实用的小技巧为开发者使用谷歌 Colab Notebooks 提供了便利。
昱良
2021-02-09
2.6K0
教你几招,Pandas 轻松处理超大规模数据
处理大规模数据集时常是棘手的事情,尤其在内存无法完全加载数据的情况下。在资源受限的情况下,可以使用 Python Pandas 提供的一些功能,降低加载数据集的内存占用。可用技术包括压缩、索引和数据分块。
昱良
2020-11-03
1.1K0
仅需添加一行代码,即可让Pandas加速四倍 | Pandas on Ray
如何让Pandas更快更省心呢?快来了解新库Modin,可以分割pandas的计算量,提高数据处理效率,一行代码即刻开启Pandas四倍速。
昱良
2019-12-27
5.4K0
Kaggle竞赛神器—Facets:快速评估数据集质量,把控数据分析核心环节
在机器学习任务中,数据集的质量优劣对数据分析的结果影响非常大,所谓Garbage in, garbage out,数据决定模型的上限,因此数据质量成为数据分析流程不可或缺的一个环节。即使是像Kaggle那样主办方已经把数据集准备好的场景,也需要评估train set和test set的分布是否一致,存不存在偏斜等。如果两者不一致,可能会导致离线cv分数非常高,可是在leaderborad却下跌了很多,以至于大量花在模型调参上的功夫其实都白费了。
昱良
2019-08-20
1K0
8 个常用的 Python 爬虫技巧,分分钟提高效率!!
在urllib2包中有ProxyHandler类,通过此类可以设置代理访问网页,如下代码片段:
昱良
2019-07-04
5250
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档