热搜:微信 游戏 亮相 内存仅 抢不到 风林火山 电脑公司 王者荣耀 王者荣耀 万能装机 系统 xp 电脑公司 浏览器 一键重装 蜘蛛侠 快手 win7 fix realtek 微信 游戏 office mumu模拟器 微软电脑管家 22H2 secoclient 11 11 11 开始菜单 WingetUI 腾讯电脑管家 打印机 应用商店 谷歌浏览 批量下载 中国建设银行 win1032位 龙信 系统 Outlook AutoCAD 2023 Fix 迅雷 系统大师 装机大师 win7系统 WIFI sscom wps 采集 启动 植物大战僵尸 驱动人生 腾讯QQ V9.7.20 优酷 输入法 抖音 三只羊 短视频 qq 快手 系统 迅雷 注册表 学习通 红警
编辑:电脑系统网 2024-07-02 来源于:电脑系统网
系统世家 7 月 2 日信息,月之暗面 Kimi 开放平台前后文缓存(Context Caching)功能打开公测。前后文缓存适用经常要求,反复引入很多原始前后文情景,能降低长文本实体模型花费,提高工作效率。官方表示花费最大减少 90 %,首 Token 延迟时间减少 83%,提高实体模型响应时间。
系统世家附 Kimi 开放平台前后文缓存功能公测详情如下:
据了解,前后文缓存是一种数据管理技术,容许系统事先存放能被经常请求海量数据或信息。当客户要求同样信息后,系统可以直接从缓存中提供,不用重算或者从原始记录源里查。
可用需求场景如下所示:
提供各种预置视频的 QA Bot,比如 Kimi API 助手
对于固定文档集合的经常查看,比如上市公司信息披露互动问答专用工具
对静态数据代码库或知识库系统的规律性剖析,比如各种 Copilot Agent
瞬时流量极大的爆款 AI 运用,比如哄一哄手机模拟器,LLM Riddles
互动标准繁杂的 Agent 类应用等
收费表明
前后文缓存收费方式关键分为以下三个部分:
Cache 建立花费
调用 Cache 建立插口,成功创建 Cache 后,依照 Cache 中 Tokens 按照实际量收费。24 元 / M token
Cache 存放花费
Cache 生存时间内,按min扣除 Cache 存放花费。10 元 / M token / min
Cache 调用花费
Cache 调用增加量 token 的收费:按实体模型售价收费
Cache 调用频次收费:Cache 生存时间内,用户使用 chat 接口请求已建立成功 Cache,若 chat message 内容和生存里的 Cache 配对取得成功,将按照调用频次扣除 Cache 调用花费。0.02 元 / 次
公测时长:功能正式上线,公测 3 个月,公测期价格可能及时调整。
公测资质:公测期内 Context Caching 功能优先选择提供给 Tier5 级别客户,别的用户范畴放宽时间待定。
以上就是系统世家所提供的最新动态,感谢您的阅读,更多精彩欢迎关注系统世家官方网站。
2024/11/01 22:00
全国消协智慧 315 平台开通酒店电视操作复杂问题反馈渠道2024/11/01 21:01
危险的“极限”测试,揭秘特斯拉自动驾驶背后的试车员队伍2024/11/01 21:01
市场监管总局:以旧换新政策出台半年,八类家电产品品种同比增长 33%据中国民航网报道,10 月 25 日,随着停靠在西安咸阳国际机场 202 机位的东航首架 C919 国产大飞机试车各项参数正常,标志着 C919 全球首架交付机首次换发工作圆满完成。...
2024/11/01 19:00:50
蔚来 10 月交付 20976 辆汽车,同比增长 30.5%,其中蔚来交付了 16657 辆,乐道交付了 4319 辆车。
2024/11/01 18:30:01