暂无搜索历史
目前自动驾驶愈演愈烈,技术也越来越成熟,从不可能上路到现在大家抢着去感受该新技术,未来电车是趋势,该领域的技术会是研究者关注的热点的话题。今日,我们“计算机视觉...
源码地址:https://github.com/icey-zhang/SuperYOLO
今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。
现在的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。
论文标题:OneBit: Towards Extremely Low-bit Large Language Models
去年 12 月,新架构 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 发起了挑战。如今,谷歌 DeepMind「Hawk 」和「Griff...
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提...
早期目标检测(OD,object detection)是许多动态系统安全的关键任务。目前的OD算法对于远距离的小物体的成功率有限。
论文地址:https://stability.ai/research/stable-video-diffusion-scaling-latent-video-d...
大多数3D重建方法可能仅恢复高达全局尺度模糊度的场景属性。我们提出了一种新的单视图度量方法,该方法可以仅使用在无约束条件下获取的单眼图像来恢复由物体的3D高度或...
Github开源地址:https://github.com/thb1314/mmyolo_tensorrt/
在 AI 绘画领域,很多研究者都在致力于提升 AI 绘画模型的可控性,即让模型生成的图像更加符合人类要求。前段时间,一个名为 ControlNet 的模型将这种...
全新视觉提示方法 SoM(Set-of-Mark),让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。
大数据预训练的驱动下,Segment Anything Model(SAM)已被证明是一个强大的可提示框架,彻底改变了分割领域。尽管具有普遍性,但在没有人工提示...
ChatGPT(全名:Chat Generative Pre-trained Transformer),是OpenAI研发的聊天机器人程序,于2022年11月3...
介绍了一种新的多支路线性Transformer网络,称为MB-TaylorFormer,能够有效且高效的进行图像去雾任务。
https://openaccess.thecvf.com/content/CVPR2022/papers/Han_Few-Shot_Object_Detect...
识别交通标志是智能驾驶系统环境感知技术的重要组成部分。在现实应用中,交通标志识别很容易受到光照强度、极端天气和距离等变量的影响,这增加了智能车辆的安全风险。
城市的火灾可能会造成毁灭性的后果,造成财产损失,并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性,使得实时探测火灾具有挑战性。
小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。
暂未填写公司和职称
暂未填写个人网址