热搜:微信 游戏 亮相 内存仅 抢不到 风林火山 电脑公司 王者荣耀 王者荣耀 万能装机 系统 xp 电脑公司 浏览器 一键重装 蜘蛛侠 快手 win7 fix realtek 微信 游戏 office mumu模拟器 微软电脑管家 22H2 secoclient 11 11 11 开始菜单 WingetUI 腾讯电脑管家 打印机 应用商店 谷歌浏览 批量下载 中国建设银行 win1032位 龙信 系统 Outlook AutoCAD 2023 Fix 迅雷 系统大师 装机大师 win7系统 WIFI sscom wps 采集 启动 植物大战僵尸 驱动人生 腾讯QQ V9.7.20 优酷 输入法 抖音 三只羊 短视频 qq 快手 系统 迅雷 注册表 学习通 红警
编辑:电脑系统网 2024-10-13 来源于:电脑系统网
电脑系统网 10 月 13 日消息,苹果现在是其多模态大模型 MM 推出 1.5 这个版本的模型是基于上一代的版本 MM1 在不同的训练周期中,我们将继续延续数据驱动的训练原则,重点研究混合不同类型数据对模型性能的影响。
目前,相关模型文档已发布 Hugging Face 在计算机系统网附论文地址如下(点击此访问)。
提供这个版本的模型 10 亿-300 具有图像识别和自然语言推理能力的参数规模超过1亿。苹果的研发人员在新版本中改进了数据混合策略,显著提高了模型在多文本图像理解、视觉引用和定位方面的能力(Grounding)以及多图像推理的能力。
参考论文,团队在 MM1.5 在持续预训阶段,引入了高质量的预训阶段 OCR 数据和合成图像描述显著提高了模型对包含大量文本的图像的理解。
此外,在监督微调阶段,研究人员分析了不同数据类型对模型性能的影响,优化了视觉指令微调数据的混合模式,从而提高了模型的效率。团队表示,即使是小型模型(10、30 1亿参数版)也能表现出色。
值得注意的是,苹果还推出了专门用于视频理解的产品 MM1.5-Video 移动设备用户界面的模型和特殊处理(UI)理解的 MM1.5-UI 模型,其中 MM1.5-UI 该模型有望在未来行动 iOS 幕后的“苹果品牌”AI,它可以处理各种视觉引用和定位任务,总结屏幕上的功能,或通过与用户的对话进行交互。
尽管 MM1.5 该模型在许多基准测试中表现良好,苹果团队仍计划进一步整合文本、图像和用户交互数据,设计更复杂的架构,以改进移动设备的模型 UI 理解能力,加强“苹果牌”AI 的实力。
广告声明:文本中包含的外部跳转链接(包括不限于超链接、二维码、密码等形式)用于传递更多信息,节省选择时间。结果仅供参考。计算机系统网络上的所有文章都包含了本声明。
2024/11/01 22:00
Apple Intelligence 尚未见效,苹果仍在为营收增长而挣扎2024/11/01 21:30
部分地区不定时补货:M4 版 Mac mini 国补后 3565 元,支持 6 期免息2024/11/01 21:01
苹果 2024 款 MacBook Pro 跑分曝光:M4 Max 除 GPU 外全面超越 M2 Ultra,Geekbench 6 单核成绩首次突破 4000此外,苹果已同意以4 亿美元(当前约 28.48 亿元人民币)的价格购买 Globalstar SPE 的 40 万 B 类股(代表 20% 的股权)。
2024/11/01 20:00:59
科技媒体 AppleInsider 今天(11 月 1 日)发布博文,报道称苹果 M4 Pro 芯片的 GeekBench 跑分已曝光,单核得分为 3925,多核得分为 22669。...
2024/11/01 12:30:13