首页
学习
活动
专区
工具
TVP
发布

#模型

大模型知识库中的文档预处理的优化问题

明月AI

以前做nlp对长文本切分也略有些经验,通常就是先按段落进行切分,对于过长的段落文本,通常就是按模型(这里通常是embedding模型)能接受的输入长度,按句子的...

1620

中国团队两篇齐发:首个跨物种生命基础大模型+新型细胞命运预测AI模型发布

生信宝典

被称为20世纪人类三大科学计划之一的人类基因组计划拉开了深度解析生命奥秘的序幕。由于生命过程的多维度、高动态特点,传统实验研究手段难以系统精准地破解基因密码的底...

710

姚期智领衔提出大模型「思维」框架!逻辑推理正确率达98%,思考方式更像人类了

公众号-arXiv每日学术速递

张伊凡2021年本科毕业于于北京大学元培学院,现师从袁洋助理教授,主要研究方向为基础模型(大语言模型)的理论和算法、自监督学习、可信人工智能。

6760

节日分析神器:CUBESET-日期对比一网打尽

wujunmin

你没有看错,只写基础度量值,然后在表格界面使用CUBESET完成任意周期的对比。本文的模型非常简单,一个人员维度表(实际应用可能是区域、门店等),一个日期表,还...

6260

处理不平衡数据的十大Python库

deephub

数据不平衡是机器学习中一个常见的挑战,其中一个类的数量明显超过其他类,这可能导致有偏见的模型和较差的泛化。有各种Python库来帮助有效地处理不平衡数据。在本文...

4820

决策类AI第一股!第四范式IPO,市值270亿港元

数据猿

ChatGPT火爆出圈之后,第四范式又投入研发,跨入生成式AI的领地。2023年2月,第三范式推出SageGPT式说大模型,领先于其他互联网大厂。短短两个月时间...

3940

ChatGPT已接入互联网;美国将用E级超算模拟核反应;中国已经成为第二大开源项目贡献国丨每日大事件

数据猿

9月28日消息,OpenAI 称,ChatGPT不再局限于2021年9月之前的数据。ChatGPT现在可以浏览互联网,提供最新的权威信息,并提供来源链接。

3920

“寒冬”还是“拂晓”?第四范式成功上市率先交卷

AI科技评论

至于第四范式将如何兑现大模型的想象空间,也是他们在新一阶段的挑战,AI科技评论将持续关注第四范式在大模型时代的商业模式进展。(欢迎添加作者微信sunpx33,快...

4020

记忆是什么?记忆印记进行湍流运动的临界值和沿途损失、为什么脑纵剖面几何形状像螺旋波?解释AD的15个现象

用户1908973

请大家关注我的最新版本的预印https://arxiv.org/abs/2203.11740,我们尝试用人工智能、量子力学和流体动力学理解我们的大脑。

5950

架构案例2022(四十二)

用户9919783

某电子商务公司拟升级其会员与促销管理系统,向用户提供个性化服务,提高用户的粘性。在项目立项之初,公司领导层一致认为本次升级的主要目标是提升会员管理方式的灵活性,...

4110

Sci. China Life Sci. | 生物医药文献中化学信息的自动提取系统

DrugAI

不用chemdraw画分子,截图即刻识别;支持复杂天然产物的识别;可抵抗低分辨率、扭曲变形、无关字符、彩色背景等干扰;支持pdf批量自动定位自动识别

3820

J. Chem. Inf. Model. | 提高化合物-蛋白质相互作用预测的方法:通过使用增加的负样本进行自我训练

DrugAI

今天为大家介绍的是来自Yasushi Okuno团队的一篇论文。识别化合物-蛋白质相互作用(CPI)对于药物发现至关重要。由于实验验证CPI通常耗时且昂贵,因此...

5440

大模型遇上数智化,腾讯云与行业专家共探行业AI发展之路

TVP官方团队

腾讯 · 产品经理 (已认证)

视频:http://mpvideo.qpic.cn/0bc36yaboaaavmapqcqujnsvb5wdc73aafya.f10002.mp4?

6430

解读LangChain

半吊子全栈工匠

随着OpenAI在2020年发布了开创性的GPT-3,我们见证了LLM的普及度稳步攀升,如今还在逐渐升温发酵。这些强大的人工智能模型为自然语言处理应用带来了新的...

7230

如何消化每天 150 亿条日志,让大查询保持在 1 秒内

大数据杂货铺

这些措施共同确保了数据日常摄取的稳定性。过程中用户见证了Doris后端的稳定性能和较低的压缩分数。此外,Flink 中的数据预处理与Doris 中的Unique...

6420

FreeU | 增强图像生成质量的插件

iResearch666

When trying additional parameters, consider the following ranges:

9930

DDIM | 隐式扩散模型原理

iResearch666

7920

AI 嗅觉超人类,是噱头还是事实?

脑机接口社区

随着科技不断发展,模仿人类嗅觉感知的人工智能(AI)嗅觉识别技术得到快速发展。该技术融合了机器学习和人工智能的先进算法,能够通过检测和分析气味分子来鉴别各种物质...

5920

手把手教你用 Milvus 和 Towhee 搭建一个 AI 聊天机器人

Zilliz RDS

举个例子,如果想要搭建一个聊天机器人,Milvus 一定是其进行数据管理的首选。那么,如何让这个应用程序开发变得易于管理及更好理解,那就需要借助 Towhee(...

9940

牛叉!MIT 提出LongLoRA,微调LLaMA2,Token从4K扩展至100K

ShuYini

 利用LongLoRA微调得到的LLaMA2模型,与其它开源模型进行对比。可以发现与最先进的模型LongChat-13B性能相当。

9740
领券