于飞的博客

Dify 1.9.2 离线部署完整操作手册

本文详细介绍如何在离线 Linux x86 环境下部署 Dify 1.9.2,涵盖从有网机器导出 Docker 镜像、下载插件(支持内网 PIP 源场景与完全离线场景)、到离线机器二进制安装 Docker、导入镜像、配置 PIP 源与信任主机的全流程操作。同时包含签名验证关闭、插件包大小限制调整等离线环境特有的配置要点,以及完整的排错指南。

于飞 于飞 发布于 2026-05-20

昇腾OMG自定义算子插件原理与使用全解析

本文深入解析华为昇腾OMG离线模型生成器的自定义算子插件机制,涵盖插件原理、开发流程、编译构建、模型转换及OME推理执行的完整生命周期,帮助开发者理解从算子编写到芯片运行的完整链路。

于飞 于飞 发布于 2026-05-14

编码器与解码器:不只是名字的游戏

从编码器的双向注意力到解码器的单向生成,从词表共享到GPT为何不叫编码器,这篇文章带你理清Transformer核心模块的设计逻辑与命名迷思。

于飞 于飞 发布于 2026-04-22

祛魅 Claude Managed Agents:不过是披着托管外衣的 ReAct Agent

从技术本质、架构局限到落地场景,一篇文章讲清楚 Anthropic 最新发布的 Managed Agents 到底是什么——它不是什么革命性新产品,只是一个被高度封装、按小时收费的云端 ReAct Agent 运行时。

于飞 于飞 发布于 2026-04-18

别再被AI新词忽悠了:图编排、DeepAgents、ReAct到底是什么关系

穿透LangGraph、DeepAgents等AI框架的营销新词,用while循环、if分支和状态字典还原它们的朴素技术本质。

于飞 于飞 发布于 2026-04-18

大模型微调与强化学习的核心区别,你真的搞懂了吗?

微调是让模型学会说话,强化学习是让模型学会说好话。本文用最通俗的比喻,讲透两者的本质区别与技术流程。

于飞 于飞 发布于 2026-03-17

从 Tool 到 Skill 再到 MCP:OpenClaw 的技术演进、架构剖析与本质洞察

OpenClaw 并非凭空出现的奇迹,而是 AI Agent 技术从简单工具调用(Tool)到封装化技能(Skill),再到标准化协议(MCP)这一宏大演进路线上的集大成者。本文将深入其技术史,详细对比各代范式的优劣,并最终揭示 OpenClaw 作为“本地操作系统级智能体”的核心本质。

于飞 于飞 发布于 2026-03-15

AI 时代的职业抉择:从存储底层到算子开发与模型微调

在 AI 狂热的 2026 年,开发者该如何选择赛道?本文深度对比了传统存储开发、CUDA 算子开发以及模型微调/数据合成三个方向,分析其技术壁垒、工作痛点与未来前景,助你找到最适合自己的“生态位”。

于飞 于飞 发布于 2026-03-05

大模型推理性能指标终极指南:从TTFT、TPOT到QPS、TPS

一次性搞懂大模型服务中的TTFT、TPOT、E2E、QPS、TPS等核心性能指标,以及它们在并发压测中的关联与权衡。

于飞 于飞 发布于 2026-03-02

我玩了一周OpenClaw(小龙虾),说点大实话

一个普通用户对OpenClaw(小龙虾)的真实体验:从期待到折腾,从赚钱幻想到清醒认知。聊聊部署坑、成本陷阱,以及到底值不值得玩。

于飞 于飞 发布于 2026-03-01