随着DeepSeek的全球风靡和广泛应用,智能化的普及步伐显著加快。通过对算法、模型和系统的系统级协同创新,DeepSeek汇聚了众智与众力,创造了许多精彩成果。为了更好的使用DeepSeek-R1大模型,使其能够为我们提供更专业、准确、详细的回复,更深入地学习DeepSeek在技术、应用与伦理交织下的革新探索,北京大学将带领大家深入探讨DeepSeek的“破圈”与“扎根”之路。
分享一份由北京大学推出的对DeepSeek-R1等大模型深度学习的文档:北京大学·DeepSeek内部手册Ⅲ《DeepSeek-R1、Kimi1.5及类强推理模型开发解读》;资源介绍
北京大学·DeepSeek内部手册Ⅲ《DeepSeek-R1、Kimi1.5及类强推理模型开发解读》为我们使用DeepSeek等智能技术提供专业的思路和方案,手册Ⅲ基于深入DeepSeek强大的推理能力与长文本思考能力,以及DeepSeek-R1在复杂任务上的卓越表现,深入讲解DeepSeek是如何突破算力和泛化的瓶颈,以及在机器理解物理规律和掌握社会协作后,如何构建与之共生的新型文明契约等。为大众理解智能技术的未来发展和社会影响提供新的视角。
资源获取:
微信搜索公众号:纪元A梦,聊天界面发送:北大
更多实用资源:
http://sj.ysok.net/jydoraemon 访问码:JYAM
资源使用
内容预览:◆ 手册文档为PDF文件;
◆ 北京大学·DeepSeek内部手册Ⅲ《DeepSeek-R1、Kimi1.5及类强推理模型开发解读》主要从以下维度进行指导和讲解:
◈ DeepSeek-R1举例:自动化标记和验证;
★ 示例输入: 编写 python 代码,该代码采用数字列表,按排序顺序返回,在开始时添加 42。
◈ 自动化验证方法:
★ 利用软件检查代码补全判断是否为完整代码;
★ 执行Python代码检查运行情况判断是否为可运行代码;
★ 调用外部模块构建额外的检测单元;
★ 甚至可以更进一步,测量执行时间,使训练过程首选性能更高的解决方案;
◈ DeepSeek-R1开创RL加持下强推理慢思考范式新边界;
◈ DeepSeek-R1 Zero及R1技术剖析:
★ Pipeline总览\DeepSeek-V3 Base\DeepSeek-R1 Zero及R1细节分析;
★ RL算法的创新:GRPO及其技术细节;
◈ DeepSeek-R1背后的Insights & Takeaways:RL加持下的长度泛化\推理范式的涌现;
◈ DeepSeek-R1社会及经济效益;
◈ 技术对比探讨:
★ STaR-based Methods vs.RL-based Methods强推理路径对比(DS-R1\Kimi-1.5\o-series);
★ 蒸馏vs.强化学习驱动:国内外现有各家技术路线对比分析及Takeaways;
★ PRM & MCTS的作用;
★ 从文本模态到多模态;
★ 其他讨论:Over-Thinking过度思考等;
◈ 未来方向分析探讨:
★ 模态穿透赋能推理边界拓展:Align-DS-V;
★ 合成数据及Test-Time Scaling:突破数据再生产陷阱;
★ 强推理下的安全:形式化验证Formal Verification\审计对齐Deliberative Alignment;
◈ DeepSeek-V3拓展解读;
• • • • • •◆ 内容较多,更多内容通过文档自行查看;
资源获取:
微信搜索公众号:纪元A梦,聊天界面发送:北大
更多实用资源:
http://sj.ysok.net/jydoraemon 访问码:JYAM