News

Published: May 19, 2025

18/08/2025: Our work on “On-Policy RL Meets Off-Policy Experts in Fine-tuning LLM” was posted on ArXiv.
19/05/2025: Our work on latent computation in LLM was posted on ArXiv.
18/04/2025: We release a new framework for reinforce fine-tuning of LLM at modelscope/Trinity-RFT and ArXiv. Welcome for any discussion!
12/04/2025: Our paper on FL with selective layer fine-tuning was accepted to ISIT 2025! The paper and code are public now.

You May Also Enjoy

Introducing Trinity-RFT

3 minute read

Published: December 31, 2025

这篇文章主要是介绍一个 LLM 的 RL 训练框架 Trinity-RFT ，内容主要分为框架介绍和使用指南两部分。更详细的介绍可以参考文档。注：本文所有图片都来自 Trinity-RFT 团队[1]。

Summary of Popolar RFT Methods

12 minute read

Published: May 19, 2025

Policy Gradient