首页
AI
Mac
Halo
其他
关于
登录
菜单
首页
AI
Mac
Halo
其他
关于
于飞的博客
所有标签
#工具配置
1
#Git
1
#微架构
1
#性能优化
1
#x86
1
#CPU
1
#ARM
1
#Intel
1
#Apple
1
#iTerm2
1
#效率
1
#快捷键
1
#终端
1
#Mac
2
#AI芯片
1
#AI技术
1
#微调
1
#强化学习
1
#RLHF
1
#Homebrew
2
#包管理器
1
#教程
1
#开发环境
2
#macOS
2
#Microsoft 365
1
#OneDrive
1
#Word
1
#用户体验
1
#4A
1
#职业选择
1
#伪专家
1
#技术成长
1
#技术管理
1
#架构
1
#架构设计
1
#MCP
1
#Tool
1
#Skill
1
#AI Agent
1
#职业发展
1
#存储系统
1
#CUDA
2
#大模型微调
1
#macOS技巧
1
#大写锁定
1
#输入法设置
1
#Caps Lock
1
#MacBook
1
#推理服务
1
#大模型
2
#压测指标
1
#性能测试
1
#技术科普
1
#AI
2
#OpenClaw
2
#插件
1
#VS Code
1
#图片水印
1
#Halo
2
AI
#大模型
#微调
#强化学习
#RLHF
#AI技术
大模型微调与强化学习的核心区别,你真的搞懂了吗?
微调是让模型学会说话,强化学习是让模型学会说好话。本文用最通俗的比喻,讲透两者的本质区别与技术流程。
于飞
发布于 2026-03-17