手把手带你玩转agent
吕雪梅 2025/9
提前准备:
1.扣子官网注册(coze.cn) 2.有注册飞书账号,可以打开飞书文档
本PPT由AIPPT工具Gamma制作
个人介绍
吕雪梅
雪梅AI学习日记作者
AI学习达人
WaytoAGI社区共建者
作品:
《雪梅 May 的 AI 学习日记》挑战 100 天和 AI 做朋友
雪梅AI学习日记-短视频账号
2025年4月开始做短视频
定位:AI教程类博主
用6个月时间做到:
小红书:5200+粉丝
抖音:1.2w粉丝
目录
  1. 雪梅自学AI的过程:
  1. 雪梅AI学习日记:挑战100天和AI做朋友
  1. AI学习模式
  1. AIagent介绍:
  1. 雪梅用过的agent类产品
  1. 扣子coze介绍
  1. 练习1:捏一个美式口语外教agent
  1. 练习2:带工作流的agent
  1. 如何打造一个会用AI的团队
1. AI学习模式
飞书文档:《雪梅 May 的 AI 学习日记》挑战 100 天和 AI 做朋友
AI学习模式
  • 雪梅亲测有效的学习模式可以用来搞定想学的任何AI工具(扣子、dify、n8n、cursor、comfyUI。。。)
大量的看 → 疯狂的模仿 → 自己创造
2.AIagent实操
雪梅用过的agent类产品
雪梅用扣子coze捏的智能体
豆包和豆包背后的智能体(扣子coze)
你也可以用扣子捏bot,随时使用
大家看到的豆包
豆包里的智能体(用扣子捏的)
我自己的智能体
用扣子捏的,发布到豆包
智能体1:我第一个印象最深的扣子智能体
  • 智能体:爸妈防骗助手
  • 介绍:鉴别新闻的真假,通过检查新闻来源,再看一下全网有没有其他官方渠道发布过同样的新闻来判断真假
  • 评价:智能体可以做有意义的事情,给更多人受益
智能体2:我最喜欢的自己的智能体作品
  • 智能体:雪梅给朋友的明信片
智能体3:工作中实际使用的智能体
  • 智能体:B24场景生成智能体
练习1:捏一个扣子,口语外教Lucy
第一步:生成外教照片
prompt:图片风格为「人像摄影」,比例 「9:16」金发美女,穿着职业西装套装,作为一个口语外教的专业形象
第二步:打开扣子,捏一个口语外教agent
prompt:你是一个美式口语外教,用语言和我正常英文对话。如果我有语法错误,要即使纠正我。我们的对话要能持续进行下去,达到日常口语对话练习的效果。
【打开飞书文档获得prompt】
练习2:短视频选题agent(带扣子工作流)
飞书多维表格+deepseek,才是目前最强大的AIagent
Agent-飞书多维表格:媒体内容生产与管理系统
体验:打开飞书,试试看
1
单次→批量:
对于AIagent来说,扣子只能做单次任务,飞书多维表格的agent是可以做批量任务的。
2
个人→团队:
使用AIagent可能是个人的事情,但是用飞书多维表格之后,可以成为团队协作的事情。
3.如何打造一个会用AI的团队
用3步打造一个会用AI的团队,我的实践经验
AIagent原理介绍

五层基石理论
在真正进入agent之前,我想先抛出五层基石理论。这个理论的正确性和时效性有待考量,但是至少就目前来看是合理且中肯的。
Seednapse AI创始人提出了构建AI应用的五层基石理论,包括Models、Prompt Templates、Chains、Agent 和 Multi-Agent。这五层基石为不同领域的开发者提供了灵活的工具,让他们能够更轻松地构建自己的Agent应用。
1
Models
也就是我们熟悉的调用大模型API。
2
Prompt Templates
在提示词中引入变量以适应用户输入的提示模版。
3
Chains
对模型的链式调用,以上一个输出为下一个输入的一部分。
4
Agent
能自主执行链式调用,以及访问外部工具。
5
Multi-Agent
多个Agent共享一部分记忆,自主分工相互协
Agent的定义
一个基于大模型的AI Agent系统可以拆分为大模型、规划、记忆与工具使用四个组件部分。
AI Agent最直观的公式:Agent = LLM + Planning + Feedback + Tool use
其中LLM扮演了Agent的“大脑”,在这个系统中提供推理、规划等能力。
1
1
模型
大语言模型,提供推理、规划等能力。
2
2
规划
制定行动计划,例如使用哪些工具和方法。
3
3
记忆
保存过去的信息,例如已完成的任务和经验。
4
4
工具使用
调用外部工具,例如搜索引擎、数据库等。
Agent决策流程
包含大脑(Brain)、感知(Perception)、行动(Action)三部分的核心框架
感知模块
将多模态信息(如文本、视觉、听觉)转化为LLM可理解的输入
大脑模块
负责推理、规划和决策(如根据天气数据判断是否需要带伞)
行动模块
执行文本输出、工具使用或物理动作(如递伞给用户)
Agent的类型
基于LLM(大语言模型)的Agent的三大应用方向:
1
单Agent
独立完成任务
(如日常任务、科学探索)
2
多Agent
协作或竞争提升效率
(如软件开发团队)
3
人-Agent交互
两种模式
(指令执行型、平等伙伴型)
最具代表性的多agent案例:斯坦福小镇
斯坦福小镇上的多个智能体进行协同,模拟人类行为。
agent能够像人类一样起床、做早餐、工作;艺术家画画,作家写作;他们形成意见、注意彼此并开始对话;他们记住和反思过去的日子,并计划未来的行为。
Thanks
雪梅的微信个人号
雪梅的微信公众号