首页
学习
活动
专区
工具
TVP
发布

山行AI

山行AI(原开发架构二三事),后续专注于AI应用领域
专栏作者
299
文章
659408
阅读量
57
订阅数
十亿行大数据挑战——用Java快速聚合文本文件中的10亿行的有趣探索
一亿行挑战(1BRC)是一项有趣的探索,旨在了解现代Java在从文本文件中聚合十亿行数据方面的极限。拿起你的(虚拟)线程,使用SIMD,优化你的GC,或者尝试其他任何技巧,创建解决此任务的最快实现!
山行AI
2024-01-05
6440
将文本输入或网址转换为知识图谱的AI应用—instagraph
大家好,欢迎来到 InstaGraph,这是一款将文本或网址转换为富有洞察力的知识图谱的应用程序。对复杂主题中实体之间的关系感到好奇吗?只需将文本输入 InstaGraph,即刻呈现出一张精美的知识图谱。
山行AI
2023-12-14
3350
「sd插件第一篇」sd-webui-EasyPhoto 您的智能 AI 照片生成器
在人工智能盛行的当下,各类大模型如雨后春笋般争先恐后地破土而出,AI绘画作为其中极其重要的一员也不停地向我们展示出它的强大能力。本文是笔者在做证件照时发现的一款stable-diffusion webui的插件,极其好用,向大家推荐一下。从本篇开始,笔者会陆续推出stable-diffusion和Midjourney相关的内容梳理了,后续会推出一系列的stable-diffusion webui的插件教程和讲解,敬请期待。
山行AI
2023-09-08
1.7K0
「长文」可能是目前最全的LangChain AI资源库之一
本文是对之前整理过的一版LangChain资源库的更新版本,原整理的地址为:基于LangChain的优秀项目资源库
山行AI
2023-09-08
1.9K0
盘一盘可以给开发人员提效的人工智能/AI开发者工具
这是一个精选的人工智能开发者工具列表。这些工具利用人工智能来辅助开发人员完成代码补全、重构、调试、文档编写等任务。
山行AI
2023-09-08
5380
GPT Academic——一款可做GPT 学术优化的AI应用
本文旨在向大家介绍一款在学术研究上非常有用的AI应用项目,该项目主要功能如下:1.为ChatGPT/GLM提供了图形交互界面,ui界面简洁明了,特别优化论文阅读/润色/写作体验;2.模块化设计,支持自定义快捷按钮&函数插件,拓展性强;3.支持Python和C++等项目剖析&自译解功能;4.PDF/LaTex论文翻译&总结功能;5.支持并行问询多种LLM模型;6.支持清华chatglm2等本地模型。兼容复旦MOSS, llama, rwkv, newbing, claude, claude2等。
山行AI
2023-08-10
1.8K0
RWKV——一种具有Transformer级别LLM性能的RNN
RWKV是一种具有Transformer级别LLM性能的RNN,也可以像GPT Transformer一样直接进行训练(可并行化)。它是100%无注意力的。您只需要在位置t处的隐藏状态来计算位置t+1处的状态。您可以使用“GPT”模式快速计算“RNN”模式的隐藏状态。
山行AI
2023-08-10
7310
AI文档智能助理都是如何处理pdf的?
在AI盛行的当下,基于文档的本地知识库智能问答系统已经成为当下最受AI从业者欢迎的落地方式。本文旨在收集整理当下AI应用中使用较多的处理pdf的库和开源项目,喜欢的请点赞、收藏。
山行AI
2023-08-10
6710
LocalAI——一款可在消费级硬件上本地运行 LLMs的AI应用
在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业。笔者前前后后调研过无数个AI应用项目,它们都是各自应用场景中的佼佼者。今天介绍的LocalAI 是一个符合 OpenAI API 规范的 REST API,用于本地推理。它允许您在消费级硬件上本地或本地运行 LLMs(不仅仅是)支持多个与 ggml 格式兼容的模型系列,不需要 GPU。
山行AI
2023-08-10
5.1K0
open-llms 开源可商用的优秀大模型资源库
在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业。相信现在各大公司都在进行着不同程度的AI布局,有AI大模型自研能力的公司毕竟是少数,对于大部分公司来说,在一款开源可商用的大模型基础上进行行业数据微调也正在成为一种不错的选择。
山行AI
2023-06-26
7940
优秀的多模态大模型(LLM)资源库
在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业。笔者认为,如果说ChatGPT引领了AI革命的开端,那么多模态大模型一定代表着AI应用的未来。
山行AI
2023-06-26
1.4K0
基于LangChain的优秀项目资源库
在AI盛起的当下,各类AI应用不断地出现在人们的视野中,AI正在重塑着各行各业,LangChain是从事AI应用开发的人员或多或少都会接触到的框架。LangChain是一个令人惊叹的框架,可以在极短的时间内完成LLM项目,其生态系统正在快速发展。
山行AI
2023-06-26
2K0
FinGPT——为金融领域的大模型应用提供了更多的可能
在ChatGPT引领的AI浪潮下,涌现了一大批优秀的AI应用,AI正在不断地重塑一个又一个行业,今天介绍的这个AI项目是跑进github前三甲的金融领域的代表:FinGPT。
山行AI
2023-06-26
2.3K0
pdfGPT——通过AI与上传的PDF文件进行聊天
在AI浪潮风起云涌的当下,AI正在不断地重塑着每一个行业。笔者的目标是在公众号中把所有当下流行的AI应用都梳理一遍,在整理技术拓展思路的同时也给大家做一个科普。有一段时间没有介绍aigc相关的应用了,今天翻到了一个很早之前调研过的火了很久的一个项目—pdfGPT。
山行AI
2023-06-14
2.1K0
OpenLLM大模型排行榜
大模型排行榜链接地址为:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
山行AI
2023-06-14
1.4K0
本草[原名:华驼(HuaTuo)]: 基于中文医学知识的LLaMA微调模型
在大模型兴起的时代浪潮引领下,无数款AI应用应运而生,本文的核心目标除了技术知识科普外,还有还重要的一点,就是进行知识梳理。
山行AI
2023-06-14
1.4K0
Elasticsearch索引、搜索流程及集群选举细节整理
最近在做搜索推荐相关的优化,在对elasticsearch进行优化时查阅了比较多的资料,现在对其中的一部分进行整理和翻译,做一个记录。主要分为三个部分:
山行AI
2021-08-18
1.6K0
es中的analyzer,tokenizer,filter你真的了解吗?
最近在做搜索推荐相关的需求,有一个场景中需要某一列能处理多种分词器的分词匹配,比如我输入汉字或拼音或语义相近的词都需要把匹配结果返回回来。经过一番调研,最终我们选择了elasticsearch来处理数据的索引与搜索,在配置分词器时会发现大多分词器配置中都需要配置analyzer、tokenizer、filter,那么这三个东西分别代表着什么,又有什么样的联系呢?这就是本文要重点讨论的事情。关于如何在elasticsearch中使用分词器[1]以及常用的中文分词器[2]和拼音分词器[3]是什么,该怎么样去配置这些问题不是本文要讨论的重点,链接都已经奉上,需要的自取。本文咱们就来聚焦讨论一下analyzer、tokenizer、filter之间的区别与联系。
山行AI
2021-07-23
5.9K0
Flink RocksDB State Backend:when and how
流处理应用程序通常是有状态的,“记住”已处理事件的信息,并使用它来影响进一步的事件处理。在Flink中,记忆的信息(即状态)被本地存储在配置的状态后端中。为了防止发生故障时丢失数据,状态后端会定期将其内容快照保存到预先配置的持久性存储中。该RocksDB[1]状态后端(即RocksDBStateBackend)是Flink中的三个内置状态后端之一。这篇博客文章将指导您了解使用RocksDB管理应用程序状态的好处,解释何时以及如何使用它,以及清除一些常见的误解。话虽如此,这不是一篇说明RocksDB如何深入工作或如何进行高级故障排除和性能调整的博客文章;如果您需要任何有关这些主题的帮助,可以联系Flink用户邮件列表[2]。
山行AI
2021-04-16
2.9K0
flink分析之Task的生命周期
之前有想过系统地来一番flink源码分析系列,谁曾想工作中需要完成的需求有些多,完整的flink源码分析系列只能一再往后拖了。之前公众号后台有想学习flink的朋友留言想看更多学习flink的资料,现在先发一些之前收藏的关于flink相关的文章,其中大多翻译自flink社区,希望能给大家带来一些帮助。本文[1]主要围绕flink任务的生命周期展开。
山行AI
2021-04-16
1.5K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档