首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#模型

考试宝携手腾讯云,用混元大模型驱动教育创新

腾讯云AI

12月19日,在线教育平台考试宝宣布与腾讯云达成深度战略合作。考试宝将结合腾讯混元大模型业界领先的技术能力,进一步创新产品应用场景,提升产品功能体验。

1700

天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

新智元

尽管研究人员的目标是让模型在一次查询中生成所有必要的辅助点,但在实践中,他们发现通常需要多次调用模型,以利用先前生成的辅助点。允许模型生成多个辅助点能够加速求解...

1800

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

新智元

为公平评估模型的表现,针对每个问题,每个模型均会进行4次重复评估,最后计算出平均得分以及模型运行成本(以美元计)。

1100

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

新智元

在大语言模型(LLMs)和多模态大语言模型(MLLMs)中,思维链(CoT)在复杂推理方面非常有效。

1800

最简单的方式本地部署DeepSeek,小白都可以学会

ICT系统集成阿祥

DeepSeek(中文名:深度求索)是一款由杭州深度求索 人工智能基础 技术研究有限公司开发的人工智能模型。它的英文名“DeepSeek”可以读作“深思”(De...

1200

DeepSeek爆了,问问它《哪吒2》今年为啥爆火

wayn

可以看到不同于以往大模型,DeepSeek R1 模型(深度思考)在生成文本的过程中,通过思维链将联网搜索得到的个网页信息分而处理,推理过程中不断反思和验证自己...

1800

浏览器里的 AI 工作台:用 Page Assist 零代码打造私有化智能助手

徐建国

Page Assist 是一款专为开发者设计的开源浏览器扩展,赋能用户在浏览器环境中直接调用本地 AI 模型(如 Ollama、Gemini Nano 等),通...

14410

DeepSeek 装进 VSCode,编程非常丝滑!

用户1220090

更贴心的是,还可以通过 Ollama 使用本地模型,让开发者可以根据自己的实际需求和预算自由选择最适合的 AI 模型。

1000

RockyLinux9.5下使用ollama搭建本地AI大模型DeepSeek

yuanfan2012

先使用下载 https://ollama.com/download/ollama-linux-amd64.tgz 然后修改https://ollama.com...

200

【多模态大模型实战】 搭建DeepSeek Janus-Pro 7B 多模态模型,以及推理微调,推理后的模型融合

AI浩

ms-swift是魔搭社区提供的大模型与多模态大模型训练部署框架,现已支持450+大模型与150+多模态大模型的训练(预训练、微调、人类对齐)、推理、评测、量化...

1300

DeepSeek V3、DeepSeek R1 、 DeepSeekLLM版本区别

Linux运维技术之路

目前网络上经常听到DeepSeek各种版本(V3、R1、LLM),但是具体版本与版本有哪些功能、区别,以及本地部署服务器配置如何建议,以下是对这些不同版本的 D...

12500

普通人上手 Deepseek 的实用攻略

架构精进之路

Ollama 安装之后,只是相当于把一个舞台搭好了,想要在本地玩转模型,需要自行选择安装模型就好了。

4300

“李飞飞团队50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

深度学习与Python

近日,“李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用,成功训练出了一个名为 s1 的人工智能推理模型”的消息引起了很多人关注。该模型名...

1100

等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开

深度学习与Python

OpenAI 新推出的 Deep Research 功能令人瞩目,但目前仅向订阅了 OpenAI 每月 200 美元 ChatGPT Pro 计划的用户提供。在...

2900

o1 不是聊天模型

深度学习与Python

当使用 Claude 3.5 Sonnet 或 4o 等聊天模型时,通常你会先提出一个简单的问题和一些上下文信息。如果模型需要更多的上下文,它通常会询问(或者从...

600

基因组数据在精准医学中扮演什么角色

生信菜鸟团

研究采用Cox比例风险模型来分析基因突变与患者总体生存率(OS)之间的关系,并使用逆概率处理加权(IPTW)方法调整潜在的混杂变量,如年龄、性别、种族、肿瘤分期...

1700

国内第一批用DeepSeek"搞钱"的人出现了,上当人数超预期

宫水三叶的刷题日记

在同一个对话中,你能够在多种模型之间来回切换,而不用担心"上下文"丢失的问题(例如在默认模式上提问后,切换到深度思考模式,模型还会"记得"此前的对话内容)。

2500

Nat. Methods|Nucleotide Transformer:人类基因组大模型新突破

实验盒

近年来,自然语言处理(NLP)领域的快速发展为生物信息学带来了新的研究工具,尤其是大语言模型(如BERT、GPT)在蛋白质结构预测和基因调控分析中的成功应用,揭...

1900

GenomeOcean:基于宏基因组的大规模基因组基础模型

实验盒

基因组基础模型(Genome Foundation Models, gFMs)作为计算生物学和生物信息学领域的重要工具,正在逐步改变精准医学、药物发现和复杂生物...

2600

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

机器之心

基础模型。我们研究了由不同组织开发的各种基础模型系列,包括 Qwen-2.5、Qwen-2.5-Math、DeepSeek-Math、Rho-Math 和 Ll...

1300
领券