OpenAI 在 o4-mini 推理模型中引入强化微调技术(RFT),通过设计评分函数优化模型输出,降低对标注数据的依赖。该技术适用于复杂任务,如医疗、税务和法律领域,已帮助多个企业显著提升模型性能。RFT 向认证组织开放,训练费用为每小时 100 美元,并提供数据共享折扣激励。这一创新将推动 AI 在更多领域的应用与发展。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验