DeepSeek 在知乎发布技术文章,介绍了其 DeepSeek-V3/R1 推理系统的优化细节,目标是提高吞吐量和降低延迟,通过大规模跨节点专家并行实现。文章还首次披露了理论成本和利润率信息,假设 GPU 租赁成本为 2 美金 / 小时,总成本为 87,072 美金 / 天,而按照 DeepSeek R1 的定价计算,一天的总收入可达 562,027 美金,理论利润率为 545%。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验