于飞的博客

大模型微调与强化学习的核心区别,你真的搞懂了吗?

微调是让模型学会说话,强化学习是让模型学会说好话。本文用最通俗的比喻,讲透两者的本质区别与技术流程。

于飞 于飞 发布于 2026-03-17