腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
喔家ArchiSelf
一个20多年的老码农 一个半吊子全栈工匠
专栏成员
举报
348
文章
426560
阅读量
43
订阅数
订阅专栏
申请加入专栏
全部文章(348)
其他(63)
模型(54)
数据(53)
编程算法(25)
数据库(24)
人工智能(23)
分布式(22)
神经网络(20)
api(19)
系统(19)
深度学习(18)
存储(18)
物联网(18)
安全(17)
性能(17)
机器学习(16)
sql(15)
网站(13)
网络安全(13)
https(13)
大数据(12)
数据分析(12)
区块链(11)
企业(11)
搜索(11)
语音识别(10)
linux(10)
数据结构(10)
android(9)
知识图谱(9)
缓存(9)
微服务(9)
NLP 服务(8)
python(8)
架构(8)
框架(8)
网络(8)
java(7)
嵌入式(7)
ide(7)
http(7)
工具(7)
函数(7)
腾讯云测试服务(6)
数据处理(6)
架构设计(6)
操作系统(6)
优化(6)
硬件开发(5)
容器(5)
游戏(5)
自动化(5)
强化学习(5)
云计算(5)
编码(5)
索引(5)
LLM(5)
git(4)
github(4)
devops(4)
系统架构(4)
隐私计算(4)
部署(4)
产品(4)
管理(4)
论文(4)
云点播(3)
php(3)
node.js(3)
搜索引擎(3)
unix(3)
渲染(3)
开源(3)
运维(3)
tcp/ip(3)
sdk(3)
web(3)
插件(3)
程序(3)
代理(3)
服务(3)
量化(3)
路由(3)
内核(3)
设计(3)
实践(3)
语音(3)
负载均衡(2)
比特币(2)
数字货币(2)
数据挖掘(2)
javascript(2)
css(2)
html(2)
云数据库 SQL Server(2)
nosql(2)
打包(2)
文件存储(2)
访问管理(2)
TDSQL MySQL 版(2)
消息队列 CMQ 版(2)
数字营销(2)
serverless(2)
shell(2)
hadoop(2)
gui(2)
cdn(2)
rpc(2)
敏捷开发(2)
kernel(2)
机器人(2)
windows(2)
数据可视化(2)
kafka(2)
虚拟化(2)
性能测试(2)
数据集成(2)
智能家居(2)
agent(2)
app(2)
nlp(2)
ranking(2)
token(2)
编程(2)
变量(2)
测试(2)
服务器(2)
工作(2)
互联网(2)
解决方案(2)
进程(2)
开发(2)
可视化(2)
浏览器(2)
内存(2)
排序(2)
配置(2)
全栈(2)
软件开发(2)
事务(2)
线程(2)
协议(2)
隐私(2)
主机(2)
向量数据库(2)
DeepSeek(2)
云镜(主机安全)(1)
人脸识别(1)
ios(1)
objective-c(1)
mac os(1)
swift(1)
c 语言(1)
c++(1)
perl(1)
erlang(1)
xml(1)
json(1)
ajax(1)
单片机(1)
汇编语言(1)
arm(1)
负载均衡缓存(1)
apache(1)
容器镜像服务(1)
云函数(1)
全站加速网络(1)
API 网关(1)
语音合成(1)
图像处理(1)
高性能计算(1)
混合云存储(1)
日志数据(1)
智能硬件(1)
数据安全(1)
云联网(1)
黑客(1)
压力测试(1)
spark(1)
html5(1)
图像识别(1)
jvm(1)
dns(1)
监督学习(1)
推荐系统(1)
决策树(1)
aop(1)
单元测试(1)
gcc(1)
socket编程(1)
uml(1)
微信(1)
小程序(1)
事件总线(1)
联邦学习(1)
零信任安全(1)
数据湖(1)
alexa(1)
amazon(1)
bug(1)
chatgpt(1)
code(1)
cpu(1)
ddl(1)
foundationdb(1)
gpu(1)
import(1)
message(1)
prompt(1)
pwa(1)
redirect(1)
rsa(1)
state(1)
tree(1)
txt(1)
uri(1)
virtual(1)
编译(1)
程序员(1)
创业(1)
递归(1)
队列(1)
对象(1)
翻译(1)
高性能(1)
工程师(1)
行业(1)
基础(1)
集合(1)
集群(1)
架构模式(1)
监控(1)
客户端(1)
连接(1)
流量(1)
敏捷(1)
苹果(1)
日志(1)
软件(1)
软件工程(1)
软件架构(1)
设计模式(1)
事件(1)
数据类型(1)
算法(1)
调试(1)
统计(1)
通信(1)
系统设计(1)
线程池(1)
性能分析(1)
性能优化(1)
学习笔记(1)
压缩(1)
重构(1)
数字孪生(1)
LoRa(1)
腾讯云架构师技术同盟(1)
搜索文章
搜索
搜索
关闭
架构设计过程中的10点体会
架构设计
产品
架构
解决方案
敏捷
在软件工程领域,任何脱离实际业务需求的架构设计都是一种不负责任的行为,甚至可以称之为"技术层面的形式主义"。这种设计倾向往往表现为过度追求技术新颖性、盲目采用复杂架构模式,或者为了架构而架构的设计理念。很多技术债务也是由于架构设计与业务需求脱节造成的。
半吊子全栈工匠
2025-03-03
19
0
解读DeepSeek-R1
模型
数据
系统
性能
DeepSeek
DeepSeek-R1 并不是从零开始训练的。它从一个比较强大LLM (DeepSeek-V3-base)开始,进而成为一个推理大模型。为了做到这一点,使用了强化学习(RL),当 LLM 做了一些有益于推理的事情时,进行奖励,否则进行惩罚。
半吊子全栈工匠
2025-02-25
205
0
DeepSeek 到底用了多少GPU呢?
DeepSeek
人工智能
缓存
gpu
模型
【引子】近来,大家一直在谈论 DeepSeek R1,即 671B 的参数巨兽。如果得到这样的一个大模型,到底花费了600 万美元还是2.48 亿美元呢?到底用了多少张GPU呢?
半吊子全栈工匠
2025-02-10
2.3K
0
性能优化之动态加载
性能优化
插件
程序
函数
系统
在过去近三十年的职业生涯里,有几年专注于运行时环境的开发与实现。在runtime中,动态加载技术是其中的基石之一。动态加载技术是指在系统运行过程中,根据需要把程序和数据从外存或网络加载到内存中的过程。其中,lazy loading(懒加载),也被称为延迟加载,是动态加载技术的一种常见实现方式。
半吊子全栈工匠
2025-01-20
105
0
性能约定:API 限速
流量
日志
性能
api
管理
速率限制是一种关键的控制机制,用于管理 API 的请求流,非常类似于调节器。速率限制不仅仅是控制请求的总数,它还关系到如何以及在哪里应用这些限制。根据 API 的需要,可以根据各种因素(如用户 ID、 IP 地址或特定类型的 API 调用)来实现速率限制。
半吊子全栈工匠
2025-01-13
113
0
微秒级高性能网络初探
协议
队列
高性能
数据
网络
如果我们的预期是将网络延时从10ms 降低到1ms,那么应该先分析这些时延的具体构成,很有可能瓶颈并不是网络传输;如果目标是将网络延时降低到微秒级或者百微秒级,那么我们才可能使用到高性能网络,例如RDMA技术。
半吊子全栈工匠
2025-01-07
113
0
大模型应用的10个架构挑战
腾讯云架构师技术同盟
ChatGPT 从正式发布到拥有1亿用户仅仅用了5天的时间,基于大型语言模型(简称大模型,或基础模型)的应用给软件行业乃至整个社会带来巨大的影响。作为一名软件系
半吊子全栈工匠
2024-12-24
575
0
大模型应用系列:从MLOps到LLMOps
模型
数据
性能
机器学习
部署
【引子】在IT领域中,DevOps 是软件工程效能的重要方法论以及工具集, 在人工智能领域同样如此。
半吊子全栈工匠
2024-12-23
138
0
WEB语义化的新探索:浅析LLMs.txt
web
工具
人工智能
网站
txt
【引】有人迷恋使用大模型生成各种有趣的内容, 有人沉醉于大模型相关技术的探索,没有对错,只在于你的乐趣所在。
半吊子全栈工匠
2024-12-19
177
0
浅析面向场景的大模型应用框架选择
数据
缓存
安全
框架
模型
【引】人们经常用“具体问题具体分析”来适应不确定性,工匠的思维是对问题进行分类,然后尝试是否存在通用的解法,可能不是最优的解,但肯定是一个可用的解。 对于大模型应用而言, 也是如此。
半吊子全栈工匠
2024-12-09
170
0
解读小模型——SLM
神经网络
函数
模型
数据
网络
【引】如果希望从文献途径了解一个新的领域,该领域的相关survey 论文可能是一个较好的切入点,对于日新月异的AI领域尤其如此。”Small Language Models: Survey, Measurements and Insights”一文(https://arxiv.org/pdf/2409.15790)或许可以帮助我们更好地了解SLM。
半吊子全栈工匠
2024-12-02
266
0
解读GraphRAG
知识图谱
模型
数据
搜索
系统
RAG 结合了大型语言模型和信息检索模型的力量,允许它们用从大量文本数据中提取的相关事实和细节来补充生成的响应。事实证明,这种方法在提高模型输出的实际准确性和总体质量方面是有效的。
半吊子全栈工匠
2024-11-25
331
0
初探Ranking系统的离在线满意度评估
性能
ranking
数据
搜索
系统
【引子】在上周发布了《大模型应用系列:从Ranking到Reranking》之后, 有AI 产品经理问我,如何评估Ranking 系统的性能呢? 再进一步,如何评估RAG系统的性能呢? 老码农整理了一下在搜索引擎方面的感受,遂成此文。
半吊子全栈工匠
2024-11-18
104
0
大模型应用系列:从Ranking到Reranking
排序
搜索
系统
ranking
模型
【引子】Ranking 和Reranking又是一个NLP 处理中的传统技术, 那么在大模型应用中又起到怎样的作用呢?
半吊子全栈工匠
2024-11-11
262
0
大模型应用系列:Query 变换的示例浅析
存储
import
量化
模型
LLM
【引】NLP中的经典组件在大模型应用中还有效么?大模型对自然语言处理中的典型任务有什么影响么?
半吊子全栈工匠
2024-11-07
172
0
初探大模型压缩
数据
性能
压缩
量化
模型
【引】感谢大家对联想AIPC的关注!大模型在智能终端上应用使AI更方便地服务于我们的工作和生活,《从苹果智能看端上大模型应用》为我们提供了参考。
半吊子全栈工匠
2024-11-07
118
0
解读向量索引
索引
存储
集群
数据
搜索
向量嵌入是从图像、文本和音频等数据源转换而来的数字表示,旨在通过为每个项目创建一个数学向量来捕捉其语义或特征。这种表示方式使得计算系统更容易理解这些数据,并且与机器学习模型兼容,从而能够识别不同项之间的关系和相似性。
半吊子全栈工匠
2024-11-07
299
0
雕虫:如何确定Java线程池的大小
java
服务
线程
线程池
性能
在 Java 中,创建线程会产生显著的成本。创建线程消耗时间,增加请求处理的延迟,并且涉及 JVM 和操作系统的大量工作。为了减轻这些开销,需要使用线程池。本文将深入探讨确定理想线程池大小的技巧。
半吊子全栈工匠
2024-11-07
103
0
解读知识图谱的自动构建
对象
模型
数据
知识图谱
存储
【引】在AI领域, 知识系统过时了么?在《大模型应用的10种架构模式》中, 知识图谱与大模型的结合是一种重要的应用方式。知识图谱可以辅助大模型应用的推理,大模型也可以辅助知识图谱的构建,二者是可以相辅相成的。在国庆假期中,读了一篇论文“A comprehensive survey on Automatic Knowledge graph Construction”(https://arxiv.org/abs/2302.05019),整理成文。
半吊子全栈工匠
2024-11-07
167
0
解读文本嵌入:语义表达的练习
模型
数据
搜索
编码
可视化
【引子】近来在探索并优化AIPC的软件架构,AI产品经理关于语义搜索的讨论给了自己较多的触动,于是重新梳理嵌入与语义的关系,遂成此文。
半吊子全栈工匠
2024-11-07
106
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档