教师

皮皮鲁的AI星球

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

深度学习是深度神经网络的简称。简单来说，神经网络是由很多个下面的公式组成，而深度神经网络是由很多个神经网络层堆叠而成的。

一文读懂深度学习训练过程

超参数指的是模型参数（权重）之外的一些参数，比如深度学习模型训练时控制梯度下降速度的学习率，又比如决策树中分支的数量。超参数通常有两类：

超参数调优算法与调度器详解：网格搜索、贝叶斯、Hyperband、PBT...

Python pandas、NumPy、scikit-learn 只能在单机运行，如果你还还在困扰如何将这些任务横向扩展，这本书正适合你！

《Python 数据科学加速》电子书开源了！

作为技术出身的我，不太会写软文广告，今天就直接来个硬广。之前与人民邮电出版社合作的《Flink原理与实践》经过一年多时间的打磨和润色，这两天终于与大家见面了，恳请各位朋友多多支持。

我整理了一份Flink流计算入门教程清单

神经机器翻译（Neural Machine Translation，NMT）借助深度神经网络对不同语言的文本进行翻译，本文主要介绍机器翻译数据集WMT16 en-de的预处理过程。

神经机器翻译数据集WMT预处理流程简介

本文同时发布在我的个人网站：https://lulaoshi.info/blog/learning-rate-schedule.html

Learning Rate Schedule：CNN学习率调整策略

Transformer[^1]论文中使用了注意力Attention机制，注意力Attention机制的最核心的公式为：

注意力机制到底在做什么，Q/K/V怎么来的？一文读懂Attention注意力机制

自BERT（Bidirectional Encoder Representations from Transformer）[1]出现后，NLP界开启了一个全新的范式。本文主要介绍BERT的原理，以及如何使用HuggingFace提供的 transformers 库完成基于BERT的微调任务。

BERT原理解读及HuggingFace Transformers微调入门

这周，IT圈一个有意思的事情是：faker.js的开源软件库作者故意加入了恶意代码，并一气之下将代码仓库删了。这个事件一度导致所有依赖faker.js的软件出现大量异常。有人分析作者Marak的主要诉求为无法维持生计，而很多大公司白嫖其工作成果，却无任何资金支持。

开源：删库、白嫖、恰饭与35岁危机

这两天科技媒体沸腾了！DeepMind继AlphaGo、AlphaFold之后，推出了Alpha系列又一神器：AlphaCode。据说这是一个可以自己写代码的AI，并且已经在实际比赛中击败了 46% 左右人类选手！

AlphaCode论文和背后原理快速解读，也许程序员短期内还不会被取代...

我第一次接触 Embedding 是在 Word2Vec 时期，那时候还没有 Transformer 和 BERT 。Embedding 给我的印象是，可以将词映射成一个数值向量，而且语义相近的词，在向量空间上具有相似的位置。

什么是词向量？如何得到词向量？Embedding 快速解读

一个 Python 软件包中的 setup.py 文件包含这个 Python 包如何打包发布等重要信息。本文主要对这篇博客(https://amir.rachum.com/blog/2017/07/28/python-entry-points/)进行了翻译解读，以解释 Python setup.py 文件中 entry_point 用法。

Python setup.py entry_points 详解

这几天各大科技媒体都在唱衰TensorFlow，鼓吹JAX。恰好前两个月我都在用JAX，算是从JAX新人进阶为小白，过来吹吹牛。

TensorFlow被废了，谷歌家的新王储JAX到底是啥？

上一篇我们分析了Hello World是如何编译的，即使一个非常简单的程序，也需要依赖C标准库和系统库，链接其实就是把其他第三方库和自己源代码生成的二进制目标文件融合在一起的过程。经过链接之后，那些第三方库中定义的函数就能被调用执行了。早期的一些操作系统一般使用静态链接的方式，现在基本上都在使用动态链接的方式。

浅谈Linux的动态链接库

C语言的经典程序“Hello World”并不难写，很多朋友都可以闭着眼将它写出来。那么编译一个“Hello World”到底经历了怎样的过程呢？

Hello World背后的故事：如何在Linux上编译C语言程序

比如，在互联网广告和推荐系统中，曾广泛使用Sigmod函数来预测某项内容是否有可能被点击。Sigmoid函数输出值越大，说明这项内容被用户点击的可能性越大，越应该将该内容放置到更加醒目的位置。

三分钟读懂Softmax函数

我在自己的网站中专门介绍过GPU的一些硬件基础知识：https://lulaoshi.info/gpu/gpu-basic/gpu.html。英伟达为优化深度学习的矩阵运算，在较新的微架构中，专门设计了Tensor Core这样的混合精度核心，因此，人工智能训练最好选择带有Tensor Core的GPU。

人工智能研究者应该选择哪款显卡？

在生物神经网络中，一个神经元（Neuron，又被称为Unit）会和多个神经元相连，当神经元兴奋时，它会向相连的神经元发送化学物质，进而改变相连神经元的电位；如果某个神经元的电位超过了阈值（Threshold），这个神经元被激活为兴奋状态，再进而向其他神经元发送化学物质。机器学习领域的神经网络（Neural Network）模型借鉴了生物学的一些思想。

前馈神经网络

为了避免过拟合，一种手段是使用正则化（Regularizaiton）来限制模型的复杂程度。Regularization从英文直译过来是“规则化”，就是说，在原来的问题求解条件上加一些规则限制，避免模型过于复杂，出现过拟合的情况。

正则化：防止模型过拟合

我的网站公示显示效果更好，欢迎访问：https://lulaoshi.info/machine-learning/linear-model/logistic-regression.html

Logistic Regression：互联网行业应用最广的模型

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了皮皮鲁的AI星球专栏，为你提供了皮皮鲁的AI星球的相关文章，致力于帮助开发者快速成长与发展。

皮皮鲁的AI星球

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐