Suny的文章
  • 首页
  • 归档
  • 分类
  • 标签
  • it-tools
  • 关于
  • 文档
    安装主题 配置指南 图标用法

共计 41 篇文章


2026

01-23
Hyper-Connections
01-16
语言模型训练与推理:从概念到代码
01-10
SAPO:Soft Adaptive Policy Optimization
01-04
从GRPO到DAPO以及GSPO

2025

12-30
理解 PPO 和 GRPO
12-21
RLHF:从策略梯度到 PPO、GAE 和 DPO
12-02
FlashAttention-3:具有异步性和低精度的快速准确注意力机制
09-30
Jet-Nemotron:高效语言模型与后神经网络架构搜索
09-21
AlphaEvolve:超级编码智能体
09-02
Mixture-of-Recursions:混合递归模型,通过学习动态递归深度,以实现对自适应Token级计算的有效适配
123…5

搜索

川公网安备 川公网安备 51015602000856号 蜀ICP备2024061486号-1