
一、 基础设施与底层驱动 (Infrastructure)
1. 问题:WSL 系统错位
2. 问题:底层二进制库冲突 (ABI Mismatch)

二、 核心算法框架安装 (Unsloth & Torch)
3. 问题:PyTorch 内部属性缺失
4. 问题:硬件精度不匹配
5. 问题:网络环境导致安装失败

三、 生产工具链集成 (LLaMA-Factory & WebUI)
6. 问题:Web 层级联依赖冲突
7. 问题:Gradio 组件接口变更
8. 问题:WSL 网络穿透失败

四、 数据工程与训练逻辑 (Data & Training)
9. 问题:微调数据的“结构化污染”
10. 问题:严重的“数值幻觉”
11. 问题:显存吃紧导致的 Loss 计算崩溃

五、 自动化与脚本化 (Automation)
12. 问题:YAML 配置格式不兼容
13. 问题:模型加载时的网络“反扑”

Debug的全过程,其本质是在一个快速进化的、版本不稳定的软件生态中,用有限的物理算力,去强行扭转一个庞大统计学系统的概率分布,使其产生出一种接近确定性的专业认知。
修环境,是在对抗软件熵。
调参数,是在对抗物理限值。
注数据,是在对抗统计惯性。
本文分享自 magicyuan的AI随笔记 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!