论文阅读五十六：DeepSeek-R1:通过强化学习激发LLMs的推理能力

发表于2025-01-23|更新于2025-01-23

|浏览量:

文章作者: Serge Wang

文章链接: https://sergewang.github.io/2025/01/23/%E8%AE%BA%E6%96%87%E9%98%85%E8%AF%BB%E4%BA%94%E5%8D%81%E5%85%AD%EF%BC%9ADeepSeek-R1-%E9%80%9A%E8%BF%87%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E6%BF%80%E5%8F%91LLMs%E7%9A%84%E6%8E%A8%E7%90%86%E8%83%BD%E5%8A%9B/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Model The World！

数据加载中