Suny的文章
  • 首页
  • 归档
  • 分类
  • 标签
  • it-tools
  • 关于
  • 文档
    安装主题 配置指南 图标用法

共计 112 篇文章


2026

01-30
Sinkhorn-Knopp算法
01-23
Hyper-Connections
01-16
语言模型训练与推理:从概念到代码
01-10
SAPO:Soft Adaptive Policy Optimization
01-04
从GRPO到DAPO以及GSPO

2025

12-30
理解 PPO 和 GRPO
12-21
RLHF:从策略梯度到 PPO、GAE 和 DPO
12-17
Fedora43更新Linux6.18 kernel Nvidia显卡驱动编译失败
12-10
DeepSeek-OCR:Contexts Optical Compression
12-02
FlashAttention-3:具有异步性和低精度的快速准确注意力机制
123…12

搜索

川公网安备 川公网安备 51015602000856号 蜀ICP备2024061486号-1