OpenAI 宣布推出 AI Agent 评测基准 PaperBench