首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

公测邀请:GreptimeAI —— LLM 应用的可观测性解决方案

随着生成式大语言模型(下文简称为:LLM)的成熟,LLM 应用的生态呈现爆炸式的增长,相应监控工具的需求也随之上升。由于 LLM 对算力要求过高,性能优化复杂,如何提供稳定可靠的服务并保证优越的用户体验极具挑战,因此在延迟、吞吐和成本等方面的实时监控能力对于 LLM 应用开发者来说至关重要。此外,目前市面上可观测性/监控工具缺乏对 LLM 领域的深层知识,也缺少业务决策的着力点,最终阻碍了应用的可持续性。

GreptimeAI 的具体信息

针对上述问题,基于早前的时序数据库产品——GreptimeDB,Greptime(格睿科技)推出了一款为 LLM 应用量身定制的可观测性解决方案——GreptimeAI,开发者可以通过该方案全面、深入地了解应用的成本、性能、流量和安全情况,在保证低成本和高性能的条件下提供高效可靠的分析能力,同时还保留时序数据库的灵活性。

GreptimeAI 提供以下一系列的跟踪和分析能力,让 LLM 应用开发者可以全面掌握各模块的运行状态:

1

成本

对成本细目进行深入分析,实时掌握成本去向,并通过分析用户的使用模式优化 Prompting 方案来降低成本。

2

生成 (Generation)

通过持续跟踪和分析模型的 Prompt Token 和 Completion Token 行为,不断调整 Prompting 方案,深度挖掘模型价值。

3

性能

监控应用中各个模块的耗时情况,快速定位性能瓶颈,提升应用表现。

04

用户

分析用户行为,收集用户反馈,不断完善 Prompting 方案,增强用户粘性。

05

Trace

利用 Trace 信息快速定位并解决根源问题,保障应用的高稳定性和高可靠性。

关于 Greptime

Greptime 格睿科技于创立于 2022 年,致力于数据库的开发工作,目前正在完善和打造时序数据库 GreptimeDB, Greptime Cloud 两款时序数据库产品和一款更适合 AI 应用的可观测工具 GreptimeAI。

GreptimeDB 是一款用 Rust 语言编写的时序数据库,具有分布式,开源,云原生,兼容性强等特点,能够帮助企业在实时读写、处理和分析时序数据的同时,降低长期存储的成本。

GreptimeCloud 基于开源的 GreptimeDB,为用户提供全托管的 DBaaS,能够与可观测性、物联网等领域结合的应用产品结合。利用云提供软件和服务,可以达到快速的自助开通和交付,标准化的运维支持,和更好的资源弹性。GreptimeCloud 已正式公测,欢迎关注公众号或官网了解最新动态!

GreptimeDB 于 2022.11.16 日在 GitHub 宣布开源,第二天即在 GitHub Global Trending 排名第一,并持续一周保持热度。截止目前,已有超 40 个活跃外部开发者持续贡献了逾百个 PR,3000+ GitHub Star。

希望更多的开发者和用户能加入我们的社区生态,共创更实用和更强大的数据库产品。

官网:https://greptime.cn/

GitHub: https://github.com/GreptimeTeam/greptimedb

文档:https://docs.greptime.cn/

Twitter: https://twitter.com/Greptime

Slack: https://greptime.com/slack

LinkedIn: https://www.linkedin.com/company/greptime

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OwKqb5C6dVudmo4hJz4l_gzg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券