机器学习算法与Python学习

880 篇文章
146 人订阅

HTTP

昱良

百度 · 研发工程师 (已认证)

【数据集】LVIS:大规模细粒度词汇级标记数据集 ,出自FAIR ,连披萨里的菠萝粒都能完整标注

最近,FAIR 开放了 LVIS,一个大规模细粒度词汇集标记数据集,该数据集针对超过 1000 类物体进行了约 200 万个高质量的实例分割标注,包含 164k...

9960
昱良

百度 · 研发工程师 (已认证)

玩转 GitHub 更新Fork

经常遇到的是Fork一个项目之后,源项目的作者做了新的更改,如果没有同步到我自己的Fork,我所做的更新进行Pull Request后,会产生冲突;因此在更新文...

7910
昱良

百度 · 研发工程师 (已认证)

Python 爬虫:8 个常用的爬虫技巧总结!

用python也差不多一年多了,python应用最多的场景还是web快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码...

10820
昱良

百度 · 研发工程师 (已认证)

别看了,这 17 道面试题因为太难被Google禁用了!

即使是最成功的公司,它的招聘过程有时也会很不靠谱,经常会出一些奇怪的看似没有答案的面试问题,但标准答案却让应聘者还没来得及接近「起跑线」就被「退赛」了。Goog...

7210
昱良

百度 · 研发工程师 (已认证)

教程 | Requests的基本用法

Requests是Python语言编写,基于urllib3,采用Apache2 Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量...

11820
昱良

百度 · 研发工程师 (已认证)

资源 | 中文NLP资源库

最近,在GitHub上,有人收罗了一份资源,汇集了40个关于中文NLP词库,涵盖了各个方面。

30820
昱良

百度 · 研发工程师 (已认证)

Pytorch | BERT模型实现,提供转换脚本【横扫NLP】

《谷歌终于开源BERT代码:3 亿参数量,机器之心全面解读》,上周推送的这篇文章,全面解读基于TensorFlow实现的BERT代码。现在,PyTorch用户的...

24810
昱良

百度 · 研发工程师 (已认证)

为什么程序员都爱格子衫?

据说,中文互联网上有三大杀器:处女座、五仁月饼和格子衬衫。最近,格子衬衫又被推上风口浪尖。现在,我们来聊聊关于格子衬衫的五个问题,探讨一下程序员和格子衫之间不得...

13530
昱良

百度 · 研发工程师 (已认证)

源码 | Python爬虫之网易云音乐下载

偶然的一次机会听到了房东的猫的《云烟成雨》,瞬间迷上了这慵懒的嗓音和学生气的歌词,然后一直去循环听她们的歌。然后还特意去刷了动漫《我是江小白》,好期待第二季…

41820
昱良

百度 · 研发工程师 (已认证)

从数学入手,3招打破机器学习工程师的边界

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。

13540
昱良

百度 · 研发工程师 (已认证)

资源 | 这是一份非常全面的开源数据集,你真的不想要吗?

1.1K20
昱良

百度 · 研发工程师 (已认证)

工具 | jieba分词快速入门

全自动安装:easy_install jieba 或者 pip install jieba

21120
昱良

百度 · 研发工程师 (已认证)

入门 | 什么是自注意力机制?

目前有许多句子表征的方法。本文作者之前的博文中已经讨论了 5 中不同的基于单词表征的句子表征方法。想要了解更多这方面的内容,你可以访问以下链接:https://...

40520

扫码关注云+社区

领取腾讯云代金券