苹果公司发布 iPhone AI 的首个预览版及相关论文,披露其人工智能模型是在谷歌的 TPU 上训练的,并介绍了为支持 Apple Intelligence 功能而开发的基础语言模型。苹果在 8192 块 TPU v4 芯片上训练云侧 AFM,使用 4096 的序列长度和 4096 个序列的批量大小,进行了 6.3 万亿 token 训练。端侧 AFM 在 2048 块 TPU v5p 芯片上进行训练。这可能表明大型科技公司在人工智能训练方面可能正在寻找英伟达图形处理单元的替代品。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验