AI浩

文章/答案/技术大牛

发布

LV1

发表了文章 2025-09-112025-09-11 20:00:45

A2Mamba：融合Transformer与Mamba的混合视觉架构

近年来，基于Transformer和Mamba的架构在计算机视觉领域展现出强大的潜力。然而，现有方法通常只是简单堆叠这两类模块，缺乏深层次的交互机制。论文《A2...

AI浩 2025-09-112025-09-11 20:00:45

架构、模型、网络、性能、工作

发表了文章 2025-09-112025-09-11 20:00:22

DyCAF-Net：动态类感知融合网络

目标检测的最新进展依赖于具有多尺度融合和注意力机制的模块化架构。然而，静态融合启发式方法和类无关注意力机制在存在遮挡、杂乱和类别不平衡的动态场景中限制了性能。我...

AI浩 2025-09-112025-09-11 20:00:23

模型、数据、网络、优化、架构

发表了文章 2025-09-112025-09-11 20:00:07

大幅节省计算成本，准确率反而飙升！DeepConf如何让AI推理既聪明又高效？

你是否曾经感叹，虽然大型语言模型在数学推理上表现出色，但生成多个推理路径导致的计算成本却令人头疼？现在，一种名为DeepConf的新方法正在改变这一局面——它不...

AI浩 2025-09-112025-09-11 20:00:07

性能、测试、工作、模型、数据

发表了文章 2025-09-112025-09-11 19:59:47

QLoRA与LoRA的深度对比：从原理到实践（小白友好版）

LoRA是"给大模型打补丁"的技术，只训练少量参数；QLoRA = 4-bit压缩大模型 + LoRA补丁，让普通电脑也能微调大模型。

AI浩 2025-09-112025-09-11 19:59:47

原理、LoRa、量化、模型、实践

发表了文章 2025-09-112025-09-11 19:59:26

【手把手教学】大模型"性格"调节指南：3个参数让你的AI听话又有趣

试试看：复制以下提示词到任意AI工具（如ChatGPT、文心一言等），分别用两组参数生成：

AI浩 2025-09-112025-09-11 19:59:27

调试、人工智能、工具、工作、模型

发表了文章 2025-09-112025-09-11 19:58:55

YOLOv8-SMOT：一种高效鲁棒的实时小目标跟踪框架：基于切片辅助训练与自适应关联

从无人机（UAV）视角对小型敏捷多目标（SMOT）——例如鸟类——进行跟踪是一项极具挑战性的计算机视觉任务。该任务的难点主要源于三个方面：目标外观特征极度稀缺、...

AI浩 2025-09-112025-09-11 19:58:55

框架、模型、设计、数据、性能

发表了文章 2025-09-112025-09-11 19:58:33

小米放大招！开源“最强7B视觉大模型”MiMo-VL：小模型干翻百B巨兽，还能一键关闭思考

当所有人都在追逐千亿参数的“AI军备竞赛”时，小米却用一个仅70亿参数的模型，打了一场教科书级的逆袭战。

AI浩 2025-09-112025-09-11 19:58:33

视频、数据、开源、测试、模型

发表了文章 2025-09-112025-09-11 19:58:08

DINOv3：无需标注的视觉革命，如何用16.89亿图像重塑AI未来

图：DINOv3在4096×4096超高分辨率下的特征表现。通过PCA将特征映射为RGB，清晰展示了模型对细节的精准捕捉能力

AI浩 2025-09-112025-09-11 19:58:09

网络、性能、监督学习、模型、数据

发表了文章 2025-09-112025-09-11 19:57:51

跟踪不稳定目标：基于外观引导的运动建模实现无人机视频中的鲁棒多目标跟踪

https://arxiv.org/pdf/2508.01730v1 多目标跟踪（MOT）旨在跟踪多个目标，同时在给定视频的帧之间保持一致的身份标识。在无人机（...

AI浩 2025-09-112025-09-11 19:57:52

模型、视频、数据、性能、对象

发表了文章 2025-08-142025-08-14 15:14:36

AI终于"心中有数"！YOLO-Count让AI绘画精准理解"五个苹果"的指令

你是否曾经遇到过这样的尴尬？向AI绘画工具输入"画五个苹果"，结果生成的图片里要么只有三个，要么堆满了七八个？这种数量控制不精准的问题，一直是文本到图像(T2I...

AI浩 2025-08-142025-08-14 15:14:36

yolo、模型、苹果、AI绘画、count

发表了文章 2025-08-142025-08-14 15:14:13

AI如何理解语言？自注意力机制的技术原理与代码实践

当你与ChatGPT、文心一言或通义千问对话时，是否曾好奇过：AI是如何理解你的话语并给出连贯回复的？为什么它能抓住句子中词语间的微妙关系，甚至能领会言外之意？

AI浩 2025-08-142025-08-14 15:14:13

实践、原理、torch、翻译、模型

发表了文章 2025-08-122025-08-12 09:09:30

深度解析：推理大模型如何改变AI格局？四种构建方法与低成本实践指南

导语：当ChatGPT回答"火车以每小时60英里的速度行驶3小时，走了多远"时，它会直接告诉你"180英里"，而推理模型会先解释"距离=速度×时间"的公式，再一...

AI浩 2025-08-122025-08-12 09:09:30

开源、模型、实践、数据、性能

发表了文章 2025-08-112025-08-11 10:17:23

小目标检测新突破：SOD-YOLO让无人机"看得更清"，性能提升36%！

在无人机翱翔的高空视角下，一个成年人可能只有"芝麻粒"大小，一辆汽车也不过是"米粒"大小。如何让无人机在数百米高空精准识别这些微小目标，一直是计算机视觉领域的"...

AI浩 2025-08-112025-08-11 10:17:23

算法、网络、性能、yolo、模型

发表了文章 2025-08-112025-08-11 10:16:51

深入剖析通用目标跟踪：一项综述

通用目标跟踪仍是计算机视觉领域一项重要且具有挑战性的任务，其难点在于复杂的时空动态变化，尤其在存在遮挡、相似干扰物和外观变化的情况下。过去二十年间，为应对这些挑...

AI浩 2025-08-112025-08-11 10:16:51

模型、搜索、网络、架构、框架

发表了文章 2025-08-062025-08-06 18:41:02

国产AI编程辅助插件汇总与分析

随着大模型技术的成熟，国产AI编程工具已从“代码补全”向“全栈开发”演进，形成三大核心趋势：

AI浩 2025-08-062025-08-06 18:41:03

开发、模型、编程、插件、工具

发表了文章 2025-07-162025-07-16 17:15:29

【跟踪实战】手把手教你SFSORT跟踪实战

SFSORT算法通过创新的动态阈值调整、区域感知轨迹管理和混合代价度量，在复杂场景下实现了鲁棒的多目标跟踪，同时通过向量化计算和内存优化保证了实时性能。

AI浩 2025-07-162025-07-16 17:15:29

frame、self、管理、视频、算法

发表了文章 2025-07-162025-07-16 17:14:37

大模型变身复读机？揭秘原因与实用解药

你是否遇到过这样的情况：满怀期待地向大语言模型（LLM）提问，得到的回答却像卡带的录音机，不断重复着相同的词语、句子，甚至整段内容？这就是困扰许多用户的LLM“...

AI浩 2025-07-162025-07-16 17:14:37

原理、开发者、模型、数据、优化

发表了文章 2025-07-082025-07-08 19:28:59

AI开源伦理临大考，如何判定抄袭

2025年7月4日，一份发布于GitHub的技术报告如同投入AI行业的深水炸弹。一位自称哥斯达黎加大学韩国学生的研究者@HonestAGI，采用“LLM指纹”技...

AI浩 2025-07-082025-07-08 19:28:59

基础、模型、开源、行业、华为

发表了文章 2025-06-242025-06-24 10:24:41

百度文心快码发布Comate AI IDE：首创设计稿一键转代码，打造多模态、多智能体协同开发环境

6月23日，在百度AI开放日上，百度智能代码助手“文心快码”迎来重大升级。百度副总裁陈洋正式发布其独立AI原生开发环境工具——Comate AI IDE。这是业...

AI浩 2025-06-242025-06-24 10:24:41

百度、开发环境、开发者、设计、ide

发表了文章 2025-06-232025-06-23 13:01:40

RAG进化论：从“字典”到“超级大脑”的跃迁之路

在AI战场，“幻觉”曾是阻碍大模型落地的头号敌人。而检索增强生成（RAG）技术，凭借其“用事实为生成保驾护航”的能力，成为企业对抗幻觉的标配武器。从2023年至...

AI浩 2025-06-232025-06-23 13:01:41

工具、框架、模型、医疗、企业

12 3 4 5 6 7 8 9 10 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2024-04-01

个人成就

获得 190 次赞同
文章被阅读 161.9K 次

关注了：1关注者：31

AI浩

A2Mamba：融合Transformer与Mamba的混合视觉架构

DyCAF-Net：动态类感知融合网络

大幅节省计算成本，准确率反而飙升！DeepConf如何让AI推理既聪明又高效？

QLoRA与LoRA的深度对比：从原理到实践（小白友好版）

【手把手教学】大模型"性格"调节指南：3个参数让你的AI听话又有趣

YOLOv8-SMOT：一种高效鲁棒的实时小目标跟踪框架：基于切片辅助训练与自适应关联

小米放大招！开源“最强7B视觉大模型”MiMo-VL：小模型干翻百B巨兽，还能一键关闭思考

DINOv3：无需标注的视觉革命，如何用16.89亿图像重塑AI未来

跟踪不稳定目标：基于外观引导的运动建模实现无人机视频中的鲁棒多目标跟踪

AI终于"心中有数"！YOLO-Count让AI绘画精准理解"五个苹果"的指令

AI如何理解语言？自注意力机制的技术原理与代码实践

深度解析：推理大模型如何改变AI格局？四种构建方法与低成本实践指南

小目标检测新突破：SOD-YOLO让无人机"看得更清"，性能提升36%！

深入剖析通用目标跟踪：一项综述

国产AI编程辅助插件汇总与分析

【跟踪实战】手把手教你SFSORT跟踪实战

大模型变身复读机？揭秘原因与实用解药

AI开源伦理临大考，如何判定抄袭

百度文心快码发布Comate AI IDE：首创设计稿一键转代码，打造多模态、多智能体协同开发环境

RAG进化论：从“字典”到“超级大脑”的跃迁之路

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI浩

A2Mamba：融合Transformer与Mamba的混合视觉架构

DyCAF-Net：动态类感知融合网络

大幅节省计算成本，准确率反而飙升！DeepConf如何让AI推理既聪明又高效？

QLoRA与LoRA的深度对比：从原理到实践（小白友好版）

【手把手教学】大模型"性格"调节指南：3个参数让你的AI听话又有趣

YOLOv8-SMOT：一种高效鲁棒的实时小目标跟踪框架：基于切片辅助训练与自适应关联

小米放大招！开源“最强7B视觉大模型”MiMo-VL：小模型干翻百B巨兽，还能一键关闭思考

DINOv3：无需标注的视觉革命，如何用16.89亿图像重塑AI未来

跟踪不稳定目标：基于外观引导的运动建模实现无人机视频中的鲁棒多目标跟踪

AI终于&quot;心中有数&quot;！YOLO-Count让AI绘画精准理解&quot;五个苹果&quot;的指令

AI如何理解语言？自注意力机制的技术原理与代码实践

深度解析：推理大模型如何改变AI格局？四种构建方法与低成本实践指南

小目标检测新突破：SOD-YOLO让无人机&quot;看得更清&quot;，性能提升36%！

深入剖析通用目标跟踪：一项综述

国产AI编程辅助插件汇总与分析

【跟踪实战】手把手教你SFSORT跟踪实战

大模型变身复读机？揭秘原因与实用解药

AI开源伦理临大考，如何判定抄袭

百度文心快码发布Comate AI IDE：首创设计稿一键转代码，打造多模态、多智能体协同开发环境

RAG进化论：从“字典”到“超级大脑”的跃迁之路

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI终于"心中有数"！YOLO-Count让AI绘画精准理解"五个苹果"的指令

小目标检测新突破：SOD-YOLO让无人机"看得更清"，性能提升36%！