当前位置：首页 > IT资讯 > 业界 > 详细页面

Kimi 开放平台上下文缓存功能公测：降低最高 90% 的使用成本

编辑：电脑系统网 2024-07-02 来源于：电脑系统网

系统世家 7 月 2 日信息，月之暗面 Kimi 开放平台前后文缓存（Context Caching）功能打开公测。前后文缓存适用经常要求，反复引入很多原始前后文情景，能降低长文本实体模型花费，提高工作效率。官方表示花费最大减少 90 %，首 Token 延迟时间减少 83%，提高实体模型响应时间。

Kimi 开放平台上下文缓存功能公测：降

系统世家附 Kimi 开放平台前后文缓存功能公测详情如下：

技术简介

据了解，前后文缓存是一种数据管理技术，容许系统事先存放能被经常请求海量数据或信息。当客户要求同样信息后，系统可以直接从缓存中提供，不用重算或者从原始记录源里查。

Kimi 开放平台上下文缓存功能公测：降

使用场景

可用需求场景如下所示：

提供各种预置视频的 QA Bot，比如 Kimi API 助手

对于固定文档集合的经常查看，比如上市公司信息披露互动问答专用工具

对静态数据代码库或知识库系统的规律性剖析，比如各种 Copilot Agent

瞬时流量极大的爆款 AI 运用，比如哄一哄手机模拟器，LLM Riddles

互动标准繁杂的 Agent 类应用等

Kimi 开放平台上下文缓存功能公测：降

收费表明

前后文缓存收费方式关键分为以下三个部分：

Cache 建立花费

调用 Cache 建立插口，成功创建 Cache 后，依照 Cache 中 Tokens 按照实际量收费。24 元 / M token

Cache 存放花费

Cache 生存时间内，按min扣除 Cache 存放花费。10 元 / M token / min

Cache 调用花费

Cache 调用增加量 token 的收费：按实体模型售价收费

Cache 调用频次收费：Cache 生存时间内，用户使用 chat 接口请求已建立成功 Cache，若 chat message 内容和生存里的 Cache 配对取得成功，将按照调用频次扣除 Cache 调用花费。0.02 元 / 次

Kimi 开放平台上下文缓存功能公测：降

公测时间与资质表明

公测时长：功能正式上线，公测 3 个月，公测期价格可能及时调整。

公测资质：公测期内 Context Caching 功能优先选择提供给 Tier5 级别客户，别的用户范畴放宽时间待定。

以上就是系统世家所提供的最新动态，感谢您的阅读，更多精彩欢迎关注系统世家官方网站。

相关信息

2024/12/01 00:29
消息称京东调整职级序列体系，原 M、P、T、S 合并为新的专业主序列 P
2024/12/01 00:29
龙芯中科：下一代桌面芯片 3B6600 研制中，GPU 芯片 9A1000 争取明年上半年流片
2024/12/01 00:29
广东省将从 12 月 1 日起实施深圳赴香港“一签多行”旅游政策

Meta 被曝将打造 4 万公里海底光缆，总投资额超 100 亿美元
消息人士表示该项目仍处于早期阶段，因为其“物理资产尚未到位”，预计 Meta 将在 2025 年初公开讨论此事，届时将确认详细计划，包括预期路线、容量和建设理由。...

2024/12/01 00:29:12
科技昨夜今晨 1130：2025 蛇年央视春晚官宣；微信内测好友通话直接邀请第三人加入；iQOO Neo10 / Pro 发布...
“科技昨夜今晨”时间，大家好，现在是 2024 年 11 月 30 日星期六，今天的重要科技资讯有：

2024/12/01 00:29:10

热门资讯

频道热点资讯

友链

本站发布的系统与软件仅为个人学习测试使用，请在下载后24小时内删除，不得用于任何商业用途，否则后果自负！如侵犯到您的权益,请及时通知我们邮箱：35336103@qq.com，我们会及时处理。

Copyright©Kimi 开放平台上下文缓存功能公测：降低最高 90% 的使用成本由电脑系统网提供技术支持鲁ICP备20014208号-8