# Agent 时代——AI 不只是聊天

作者：小傅哥
博客：https://bugstack.cn (opens new window)

沉淀、分享、成长，让自己和他人都能有所收获！😄

大家好，我是技术UP主小傅哥。

到目前为止，我们讲的 AI 都只能"输出文字"。但 2024 年开始，业界进入了 Agent（智能体） 时代。什么是 Agent？一句话：会用工具、能完成任务的 AI。

# 一、从"会说"到"会做"

graph TB
    A["传统 AI: 只会输出文字"]
    B["Agent: 会用工具、能采取行动"]

    A --> A1[你问天气]
    A1 --> A2[它瞎编一个天气]

    B --> B1[你问天气]
    B1 --> B2["它调用天气 API"]
    B2 --> B3[拿到真实数据]
    B3 --> B4[告诉你准确天气]

1
2
3
4
5
6
7
8
9
10
11

# 二、Agent 的核心组件

graph TB
    A[用户任务] --> B["Agent 大脑 大模型"]
    B --> C{需要做什么?}
    C --> D[调用搜索引擎]
    C --> E[执行代码]
    C --> F[读取数据库]
    C --> G[发送邮件]
    C --> H[操作浏览器]
    D --> I[拿到结果]
    E --> I
    F --> I
    G --> I
    H --> I
    I --> J{任务完成?}
    J -->|没有| C
    J -->|完成| K[输出最终结果]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

简单说，Agent = 大模型 + 工具集 + 一个循环：

看任务
想想要不要用工具，用哪个
用工具，拿到结果
想想下一步
循环，直到任务完成

# 三、真实世界的 Agent 例子

Cursor / Claude Code / WaLiCode：你说"帮我把这个功能改成异步的"，它自己读代码、改代码、跑测试。
Devin：号称"AI 软件工程师"，能从一个 GitHub Issue 开始，自己分析、修代码、提 PR。
企业客服 Agent：用户问问题，它查订单、查物流、查退款政策、给出处理方案。

# 四、Agent 的现状：很美好，但很难

实话说，Agent 目前还远没到"完全替代人"的地步。原因：

graph LR
    A["第1步: 90% 正确"] --> B["第2步: 90% 正确"]
    B --> C["第3步: 90% 正确"]
    C --> D["..."]
    D --> E["第10步: 整体正确率 = 0.9 的 10 次方 ≈ 35%"]

1
2
3
4
5

每一步都可能出错，错误会累积。所以现在所有靠谱的 Agent 都不是"完全自主"，而是：

把工作流程画成一张图，AI 在图上"沿着轨道走"，关键节点由 AI 决策，但整体框架由人定。

这叫 Workflow + LLM，是目前最务实的工业级 Agent 模式。

# 五、幕后故事：Devin 的"过山车"与 DeepSeek-R1 的"低成本奇迹"

Devin 的故事：2024 年 3 月，Cognition Labs 发布了 Devin，宣称是"世界上第一个 AI 软件工程师"。演示视频里它从看 Issue、读代码、写代码、跑测试、提 PR 一气呵成，整个硅谷都疯了。公司估值一夜从 0 飙到 20 亿美元。

但几个月后，AI 评测博主 Internet of Bugs 发了一条扒皮视频，逐帧分析 Devin 的演示——发现里面有大量精心剪辑、跳过失败、反复重试。真实使用率远低于演示。

这给整个行业泼了一盆冷水，让大家清醒过来：Agent 离"完全自主"还很远，目前最务实的方向是"AI 加速人，而不是替代人"。Cursor、Claude Code 这种"AI 提议、人确认"的模式，反而活得最滋润。

DeepSeek-R1 的故事：2025 年 1 月 20 日，杭州一家叫 DeepSeek 的小公司发布了 R1 模型——推理能力对标 OpenAI 当时最贵的 o1，而背后的基础模型 V3 训练成本约 557 万美元（OpenAI 同级模型据估算花了上亿美元）。更狠的是：完全开源、技术报告全公开。

这一事件直接引发了全球资本市场地震：2025 年 1 月 27 日，NVIDIA 股价单日暴跌约 17%、市值蒸发近 5890 亿美元，刷新美股单日单股市值蒸发纪录。原因很简单——如果顶级 AI 能用 1/20 的成本做出来，那"无脑买卡"的逻辑就动摇了。

R1 还有一个更重要的技术贡献：它证明了仅靠强化学习（R1-Zero 阶段），不经过 SFT，模型就能自发学会推理、反思、自我纠错。这是大模型领域近三年最重要的发现之一。

这两个故事合在一起说明一件事——AI 行业现在的速度，是按"周"在变化的。今天的明星，下个月可能就被反超；今天看似遥不可及的能力，明年可能开源到你能在自己电脑上跑。保持学习、不要押宝任何单一技术，是这个时代的生存之道。

← 幻觉——为什么 AI 会"胡说八道"？未来展望——AI 会变成什么样？ →

常用搜索	百度 Google Bing Github 搜代码
技术社区	CDSN 博客园 OSChina 思否掘金 Linux公社 IBM 开发者 StackOverflow
PDF 下载	《Java 面经手册》《重学Java设计模式》《手撸 Spring》《字节码编程》
面试求职	简历优化简历筛选大厂要求薪资待遇北漂生活
Java相关	数据结构和算法并发和锁多线程 Java8 特性 JVM 虚拟机
Spring	手写 Spring SpringCloud 入门 Mybatis 源码分析手写 Mybatis Quartz 源码分析
面向对象	设计模式 DDD 落地低代码字节码插桩画架构图系统监控中台研发规范
中间件&插件	Maven中央仓库数据库路由设计 IDEA-Plugin
Netty 4.x	基础入门中级拓展高级应用 RPC 实现 IM 仿微信
字节码编程	ASM Javassist Byte-Buddy JavaAgent ASM-DOC JVM 指令码
专栏小册	《Netty+JavaFx实战：仿桌面版微信聊天》《SpringBoot 中间件设计和开发》《Lottery 抽奖系统 - 基于领域驱动设计的四层架构实践》
知识星球	码农会锁实战项目