发布

周末程序猿

专栏成员
40
文章
11607
阅读量
13
订阅数
机器学习|从0开发大模型之复现DeepSeek的aha moment
前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的 GRPO 代码,不过从工程领域来看,并没有复现DeepSeek-R1,于是最近申请了48G的显存,结合一些开源的方案复现aha monent,并给出完整的代码和工具链。
用户1904552
2025-02-27
760
机器学习|从0开发大模型之DeepSeek的GRPO
最近,DeepSeek-R1的发布为国产大模型争光了(太强了),不过 GRPO 算法源自 DeepSeekMath 7B 模型,该模型在 MATH 基准测试中取得了优异成绩,论文发表于2024年2月份:https://huggingface.co/papers/2402.03300,以下是该论文的摘要原文:
用户1904552
2025-02-27
780
技术总结|十分钟了解GPU
最近在看《黄仁勋:英伟达之芯》,这本书讲述了英伟达是如何一步一步优化GPU,感觉创业不易,不过本文为了让大家更好了解GPU,所以简单汇总了一些知识点。
用户1904552
2025-02-27
700
机器学习|从0开发大模型-译llama3-from-scratch
最近在看一篇github上大佬的文章,从0开始训练llama3,觉得对于《从0开发大模型》有点帮助,于是翻译一下,发现其中很多内容当前系列文章的知识点相似。 原文:https://github.com/naklecha/llama3-from-scratch 其中meta-llama/Meta-Llama-3-8B文件地址:https://huggingface.co/meta-llama/Meta-Llama-3-8B/tree/main/original
用户1904552
2025-02-27
890
ChatGPT|OpenAI Days12内容介绍(1-3)
最近OpenAI的发布新功能介绍,连续12天直播,为了大家能收集到完整的视频(来源B站等其他视频网站),本期整理的是1-3天的内容介绍。
用户1904552
2025-02-27
1010
机器学习|从0开发大模型之注意力机制
无论是在机器学习,深度学习还是人工智能中,我们都在寻找一种模拟人脑的机制,注意力机制源于人脑,比如当我们欣赏一本书的时候,当我们对某个知识点感兴趣的时候,会映像深刻,可能会反复读某一段文字,但是对于其他不敢兴趣的内容会忽略,说明人脑在处理信号的时候是一定会划权重,而注意力机制正是模仿大脑这种核心的功能。
用户1904552
2025-02-27
970
机器学习|从0开始大模型之位置编码
上一篇完成DPO的训练,但是模型的输出效果不好,因此在找原因,于是将理论重新过一遍,以发现每个环节需要优化的地方,本文就是理论知识:《Transformer模型中的位置编码》。
用户1904552
2025-02-27
1070
机器学习|从0开始大模型之模型DPO训练
Rafailov等人在2023年发表了一篇论文《Direct Preference Optimization: Your Language Model is Secretly a Reward Model》,该论文提出了一种新的训练方法,称为直接偏好优化(DPO),该论文介绍:
用户1904552
2025-02-27
1680
机器学习|从0开始大模型之模型LoRA训练
继续《从0开发大模型》系列文章,上一篇用全量数据做微调,训练时间太长,参数比较大,但是有一种高效的微调方式LoRA。
用户1904552
2025-02-27
2670
机器学习|从0开发大模型之SFT训练
继续写《从0开发大模型》系列文章,上一章主要数据数据预训练,让模型能学到句子接龙和部分语言理解能力,获取基座版本,但是用基座版本的模型的对话能力太弱了,需要用大量的数据微调,本文主要介绍如何用SFT训练模型。
用户1904552
2025-02-27
1240
机器学习|从0开发大模型之模型预训练
继续写《从0开发大模型》系列文章,本文主要介绍预训练过程。 预训练是目的是让模型学习知识,需要将预处理的数据(《机器学习|从0开发大模型之数据预处理》)中生成的 pretrain_data.bin 文件的上下文全部学习到,那预训练怎么做呢?
用户1904552
2025-02-27
1100
技术总结|十分钟了解分布式系统中生成唯一ID
分布式系统中生成唯一ID在后台开发是经常遇到的架构设计,当然方案有很多,比如通过redis或者数据库实现自增。 但是如果依赖redis或者数据库,会导致单点问题,在架构上反而需要考虑点更多,那怎么解决呢?
用户1904552
2025-02-27
1070
技术总结|十分钟了解地图如何实现红绿灯读秒?
十一期间开车到五六线线城市,发现高德地图的红绿灯读秒功能竟然依旧比较精准,之前在一二线城市了解地图的读秒是使用政府交通部门的数据,那五六线城市的数据应该是没那么全,那怎么实现读秒的呢?于是找到相关高德地图专利,了解了一下原理。
用户1904552
2025-02-27
1240
技术总结|十分钟了解UV统计算法HyperLogLog
考虑到上述问题的扩展性,除了统计APP每日的独立用户登录数,还需要统计打开每个页面的独立用户数。
用户1904552
2025-02-27
920
ChatGPT|公众号接入AIAgent
之前已经考虑将公众号加入智能体,但是由于API接口返回太慢了,于是重新实现了一个页面,就变成这样:
用户1904552
2025-02-27
790
机器学习|从0开发大模型之数据预处理
前面写了一篇文章《ChatGPT|大语言模型训练有哪些开源数据集? 》(https://mp.weixin.qq.com/s?__biz=MzA3Njk4MjkyNw==&mid=2247485643&idx=1&sn=a109dea3f3f9ac1acaaad940b6a16aaa&chksm=9f59b72ba82e3e3d736a77da3ebb5bea152a0516233fbd496d7419fe3d07231905f613215bd3&token=679209878&lang=zh_CN#rd),文中列举了一些高质量的数据集合。
用户1904552
2025-02-27
900
机器学习|从0开发大模型之Tokenizer训练
继续写《从0开发大模型》系列文章,本文主要介绍从头快速训练一个Tokenizer。
用户1904552
2025-02-27
1120
机器学习|使用ONNX部署模型
在机器学习中,通常训练完成了模型该如何部署?如果直接将训练环境部署在线上,会和训练平台或者框架相关,所以通常转换为ONNX格式。
用户1904552
2025-02-27
1160
机器学习|深度学习如何自动微分
在深度学习中,求导几乎是所有优化算法的关键步骤,但是对于单个值的求导比较简单,但是如果对于模型训练过程中每次都需要手动求导就很麻烦,因此深度学习框架都提供了自动导数(自动微分)。
用户1904552
2025-02-27
550
机器学习|深度学习卷积模型
在早期的图像分类中,通常流程是先人工提取特征,然后用对应的机器学习算法对特征进行分类,分类的准确率一般依赖特征选取的方法,甚至依赖经验主义。 Yann LeCun最早提出将卷积神经网络应用到图像识别领域的,其主要逻辑是使用卷积神经网络提取图像特征,并对图像所属类别进行预测,通过训练数据不断调整网络参数,最终形成一套能自动提取图像特征并对这些特征进行分类的网络,如图:
用户1904552
2025-02-27
540
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档