Suny的文章
首页
归档
分类
标签
it-tools
关于
文档
安装主题
配置指南
图标用法
共计 41 篇文章
2026
01-23
Hyper-Connections
01-16
语言模型训练与推理:从概念到代码
01-10
SAPO:Soft Adaptive Policy Optimization
01-04
从GRPO到DAPO以及GSPO
2025
12-30
理解 PPO 和 GRPO
12-21
RLHF:从策略梯度到 PPO、GAE 和 DPO
12-02
FlashAttention-3:具有异步性和低精度的快速准确注意力机制
09-30
Jet-Nemotron:高效语言模型与后神经网络架构搜索
09-21
AlphaEvolve:超级编码智能体
09-02
Mixture-of-Recursions:混合递归模型,通过学习动态递归深度,以实现对自适应Token级计算的有效适配
1
2
3
…
5
搜索
×
关键词
博客在允许 JavaScript 运行的环境下浏览效果更佳