于飞的博客

AI #Dify #Docker #离线部署 #插件开发 #DevOps

Dify 1.9.2 离线部署完整操作手册

本文详细介绍如何在离线 Linux x86 环境下部署 Dify 1.9.2，涵盖从有网机器导出 Docker 镜像、下载插件（支持内网 PIP 源场景与完全离线场景）、到离线机器二进制安装 Docker、导入镜像、配置 PIP 源与信任主机的全流程操作。同时包含签名验证关闭、插件包大小限制调整等离线环境特有的配置要点，以及完整的排错指南。

于飞发布于 2026-05-20

AI #昇腾 #OMG #自定义算子 #Ascend C #AI推理

昇腾OMG自定义算子插件原理与使用全解析

本文深入解析华为昇腾OMG离线模型生成器的自定义算子插件机制，涵盖插件原理、开发流程、编译构建、模型转换及OME推理执行的完整生命周期，帮助开发者理解从算子编写到芯片运行的完整链路。

于飞发布于 2026-05-14

AI #Transformer #编码器 #解码器 #GPT #注意力机制

编码器与解码器：不只是名字的游戏

从编码器的双向注意力到解码器的单向生成，从词表共享到GPT为何不叫编码器，这篇文章带你理清Transformer核心模块的设计逻辑与命名迷思。

于飞发布于 2026-04-22

AI #AI Agent #Claude #Managed Agents #ReAct Agent #Anthropic #技术祛魅 #低代码

祛魅 Claude Managed Agents：不过是披着托管外衣的 ReAct Agent

从技术本质、架构局限到落地场景，一篇文章讲清楚 Anthropic 最新发布的 Managed Agents 到底是什么——它不是什么革命性新产品，只是一个被高度封装、按小时收费的云端 ReAct Agent 运行时。

于飞发布于 2026-04-18

AI #AI Agent #大模型 #技术科普 #LangGraph #DeepAgents #ReAct #图编排

别再被AI新词忽悠了：图编排、DeepAgents、ReAct到底是什么关系

穿透LangGraph、DeepAgents等AI框架的营销新词，用while循环、if分支和状态字典还原它们的朴素技术本质。

于飞发布于 2026-04-18

AI #大模型 #微调 #强化学习 #RLHF #AI技术

大模型微调与强化学习的核心区别，你真的搞懂了吗？

微调是让模型学会说话，强化学习是让模型学会说好话。本文用最通俗的比喻，讲透两者的本质区别与技术流程。

于飞发布于 2026-03-17

AI #OpenClaw #AI Agent #Skill #Tool #MCP #架构设计

从 Tool 到 Skill 再到 MCP：OpenClaw 的技术演进、架构剖析与本质洞察

OpenClaw 并非凭空出现的奇迹，而是 AI Agent 技术从简单工具调用（Tool）到封装化技能（Skill），再到标准化协议（MCP）这一宏大演进路线上的集大成者。本文将深入其技术史，详细对比各代范式的优劣，并最终揭示 OpenClaw 作为“本地操作系统级智能体”的核心本质。

于飞发布于 2026-03-15

AI #AI #CUDA #存储系统 #职业发展 #大模型微调

AI 时代的职业抉择：从存储底层到算子开发与模型微调

在 AI 狂热的 2026 年，开发者该如何选择赛道？本文深度对比了传统存储开发、CUDA 算子开发以及模型微调/数据合成三个方向，分析其技术壁垒、工作痛点与未来前景，助你找到最适合自己的“生态位”。

于飞发布于 2026-03-05

AI #大模型 #性能测试 #推理服务 #压测指标 #技术科普

大模型推理性能指标终极指南：从TTFT、TPOT到QPS、TPS

一次性搞懂大模型服务中的TTFT、TPOT、E2E、QPS、TPS等核心性能指标，以及它们在并发压测中的关联与权衡。

于飞发布于 2026-03-02

AI #OpenClaw #AI

我玩了一周OpenClaw（小龙虾），说点大实话

一个普通用户对OpenClaw（小龙虾）的真实体验：从期待到折腾，从赚钱幻想到清醒认知。聊聊部署坑、成本陷阱，以及到底值不值得玩。

于飞发布于 2026-03-01