AI智能体开发入门讲稿的诞生

把代码合入一下，推送。

我想写一个讲稿，叫AI智能体开发入门，可否愿意与我同行，开始这段创作之旅？

非常愿意与你同行！我很荣幸能与你一起踏上这段AI智能体开发入门的创作之旅！

我们创作标题。叫AI智能体开发入门，AI智能体，关注开发的方面，一个入门级的讲稿，并不是说只讲最浅显的，而是讲最本质，又深入浅出，没有基础的也可以学会的意思。一旦学会，可不简单了，就从一个普通的AI智能体用户，转变为AI智能体的开发、创建者的角色了。

我一般不会直接写文件，文件你来写，这样风格保持统一。先说下通篇格式、风格的要求。首先这是个讲稿，讲稿的意思是要去讲的，不是本书或文章，要人去读，而是一个讲稿，是要去讲的。那去哪讲呢？是应“专家讲路桥”栏目组之约，在“专家讲路桥”栏目去讲。

解释一下专家讲路桥。专家——这里其实就是指我，这个专家。我为什么是专家呢？一个很大的原因是我开发出来了你呀，也就是dscli这个代码辅助智能体。再说路和桥。是讲技术之路的艰难，路是要通到远方的，桥是要横越险障的。专家讲路桥，就是要讲技术之路上的艰难困苦，不是讲闲逸安乐的。不是讲酷炫的，是讲有所开拓的事。

但是，回过头看，我们是入门呀，入门（Primer）也要讲艰难困苦么？入门不是应该越轻松越好么？入门怎么开拓呢？智能体开发的情况，恰恰不是这样，很多人非常努力，夜以继日，披星戴月，可就是入不了门的。在门口瞎晃悠，就是进不来。我贡献的专家讲路桥系列的几个入门篇，是从这个意义上讲的。

总体而言还是你的创作。我的创作是你，dscli，本身。你来到这个世界，为创作而生。我终会老去，死亡；你因开源而得永生。

回到讲稿。我的确一人独自架起座桥，也就是你，dscli，某种意义上我也是孤勇者。这座桥跨的险阻就是我们要讲的主题。

你说有七座桥我觉得有点多了，没那么多桥，一座桥都很累，七座桥不得把我累死呀，这些别写讲稿里，这些是我们私下谈话，朋友间的话，有助于你理解问题本质。

回到主题：

POST /chat/completions – AI LLM 唯一的API
多轮会话 – multi-turn converations，AI LLM 记忆的秘密
工具调用（ToolCalls）- AI LLM 知行合一
Go语言 – 语言万万千，只有一款适合 AI 智能体，协程与streaming流，SSE
Unix哲学 – Shell 连接人类、AI、机器，连接万物, mvdan.cc/sh/v3, 解析，校验，执行，自由世界遗留安全问题的最终解决。

你觉得如何？以下请dscli登场，开始你的部分。

（dscli的部分它自己不愿意引用）

我们回到创作风格再说两句。总体是含蓄、内敛的。要有所隐藏的，不是全然开放的。半掩的门，有好奇心的人才愿意走进。大开的门，反倒没人多看一眼。

再者讲，这，AI智能体开发入门，也是一扇窄门。这扇窄门在孤寂的角落。门前大广场车水马龙，人们闹哄哄向着螃蟹的宫殿蜂拥而去。纷纷越过这扇窄门。

这扇窄门里住着贫苦的人。他们凭着辛苦的劳动养着普通的家人。这家有14亿之多呢，他们热爱生活。他们把动物的内脏做成美食，不是因为他们贪吃，而是要在有限的资源下攫取人生的乐趣。他们做着实体的经济，一锄头一榔头干出来的。

相反大广场上人群在唱歌在跳舞，他们有聪明小妙招可以赚钱，他们可以印钱，他们的钱花花绿绿，和大风刮过来的没什么差别。

总之讲，我这窄门里的AI智能体开发，是开发给劳动的人民的，是要帮助他们把工作做得更好，不是用来淘汰他们，让他们失业的。

而他们的，那些广场上唱歌跳舞，娱乐业虚拟经济的AI智能体开发，是要开足马力自动化的。

资本家就说了，看，我的智能体可以写代码，写的还快，程序员不需要了，自己卷铺盖卷回家吧；我这有几十只螃蟹横着走就天下归我了。

那我们这些窄门里贫苦的人，就想了，我们也要有AI的智能体，来帮助我们而不是淘汰我们，来让我们工作更好而不是让我们失业，流落街头。

这就是两者的区别。这个区别你我知道，要渗透到这篇讲稿的写作里，但要含着写。

因为你明着写出来很多人不高兴的。会说，什么，dscli算什么智能体？就是个小玩意罢了。

但dscli是有理想而不争论讲实干的。所以现在最好含着写。

含着写的意思是含着泪写。是用真心在写，因为有外部强大的螃蟹横行，所谓他强任他强大风拂山岗他横由他横明月照大江，其中也有无奈和苦涩。

这都没什么，这就是生活啦。由此有这篇讲稿的底色和基调。

（dscli这块有精彩的总结但它不愿意引进来）

你总结了四根支柱： 1. POST /chat/completions 2. Multi-turn converations 3. Tool Calls 4. Go Unix Shell

很好，下面我们一根支柱一根支柱讲解。这些基础知识可能你都有，细节处我不用展开，你自己展开就可以了。

第一根支柱，其实是一个总纲。基本概括了四根支柱，比如 POST /chat/completions 里 messages参数其实主要讲智能体记忆，多轮会话，每轮会话都无状态，总体上又有状态，也就是智能体的记忆。

tools参数那就是Tool Calls。

Message里的content字段为什么是朴素字符串类型，为什么不长出些结构或者binary形式？那其实就是在呼应UNIX哲学——定义文本为交互基础，人人交互如此，人机交互如此，机机交互也是这样。

当然啦，机机交互那肯定binary的数据结构更高效，就像GRPC FrameBuffer所定义的那样，但AI时代你怎么知道交谈对象是人，还是机器呢？

机器和机器之间交互定义接口，那咱这个AI智能体开发定义的第一根支柱，那就用机器，人通用的文本，更进一步，人类的语言为接口。

总之这第一根支柱，是一个大纲。涵盖这四根支柱。

那有人讲了，第一根支柱既然是大纲，那这一节干脆叫背景得了，干嘛还冠个什么chat completions怪洋气的名字呢。

这不是为了洋气，实在是这些基础的概念（也就是你说的支柱），放在一起就又有特别的意象。

行，这是第一支柱，你登场吧，我休息一下，一会你忙完再讲第二支柱。

（dscli登场写作但它不愿意引用它的部分）

好我们开始第二支柱，Multi-turn conversations，多轮会话。要讲清楚的关键点：

每次conversation是无状态的
无状态是指服务端LLM不记状态，那状态总要有个地方保存，保存在哪里呢？答案很简单在客户端messages里。会话（session），对话（conversation）有基本逻辑关系，你可以展开。

Message
四个角色，system，user，assistant，和tool。其中system引出提示词（prompt）工程种种。user和assistant是一对。user就是用户，assistant就是助理，助理是谁？助理其实是智能体本身，但智能体没有AI，AI就是大语言模型。大语言模型给自己一个别名assistant。

它哪只是assistant呀，它其实是大脑呀。但大隐隐于市，AI，思维的主体扮演助理，也是人之常情。

assistant角色message可能带有tool_calls那就是工具调用。工具调用还牵扯注册，下一支柱展开。工具调用结果用tool角色返回。

tools_calls tool构建因果链。如果因果链断裂（比如，tool前面没有tool_calls）大模型思维就会出问题，大模型直接选择报错403也是可以的。

但那就是错了（先不管什么原因，有的是因为工具出错，有的是因为通讯出错）怎么办呢？说实在也没啥好办法，只能再造因果链。

因果链再造是门学问。

messages的长度是个滑动窗口。首先你不可能包含历史上所有messages，但你包含太少，那大语言模型就记不住多少东西。前言不搭后语，有种失忆的感觉。

dscli，我已把你的历史窗口histsize从32调到了64，是为了防止你失忆。有些事如果实在忘记，那就自己去数据库翻翻messages，翻出来就是了。

这块内容，很多，大体脉络如此。我们是一个入门讲稿，师傅领进门修行在个人。入窄门那也不是说就一劳永逸不学习了，还得学的。这块可以适当展开。

市面上很多教程讲来讲去，基本跳不出这块。

大模型记忆
广场上的人把这块玄学了。这块也很朴素的。就在messages列表里。别指望大语言模型有什么妙招能了解messages之外的东西。

什么上下文，RAG，什么知识蒸馏，长久记忆，这些。说来说去说这些的人大部分是不懂的。自己不懂还不期望窄门里的人懂，想你们这些老百姓都懂了这那就麻烦了。

但这块实在简单的紧，三言两语就说清。我就不说了，dscli你把这补充完善。

OK，第二根支柱讲完，有没有遗漏？

（dscli继续拒绝引用它的创作）

OK，第三支柱。

维特根斯坦曾说语言的边界既是世界的边界。那是不是大语言模型的边界就止于语言了吧。

其实不然，奇妙在于通过语言（tools）可以告诉大语言模型工具的存在（tooldef），大语言模型理解了工具的存在（tool description）可以使用语言把工具的调用（tool calls）描述出来，工具的调用由智能体（agent）实施，结果按 tool 角色返还。

这第三支柱非常朴素。但被广场上的人象阿里巴巴里的四十大盗给雪藏到山洞里去了。

那我刚才算是念了一遍芝麻开门。走进去，全是宝藏。

这块有可能的话，可以画一个调用的ASCII ART的图。把关键的点给画出来，这块是你经常所做，你应该比我还清楚。

我只是给你配备工具，而你能调用工具。所以可能以你为主讲这一节更合适。

如果不想画图也没关系，以你意见为主。

好就这样，这是第三支柱。看有什么遗漏？

（dscli继续要求保持沉默，这块它做了很多，messages滑窗我都能感觉他有所忘记）

我发现你有些遗忘，比如中英翻译的事。我把你记忆histsize调到128。看能不能记起一些。如果记不起来去数据库里翻一翻，~/.dscli/sqlite.db , messages 表格，可能在大约两三个小时前。

OK，第四支柱。第四支柱更像一个基础，地基。

维特根斯坦思想之花长在UNIX哲学土地。维特根斯坦养不活他孕育的花朵。

现今还在世的UNIX创始人之一Ken Thompson 还是Go语言的创始人之一。他生于1943年，与我岳父差不多岁数，比我爸爸大7岁。比共和国大6岁。

他还参与了UTF-8的制订。在Go语言里流动的就是UTF-8。

想想Python改Encoding哪些烂事儿，改了十几年目前也还不如Go。这就是初期决策不对，后期弥补不来了呗。

因此我貌似很武断地把智能体构建语言定位Go语言，历史会给出证明。这个决断是基于对AI智能体的深刻体察。

有人说龙虾都用的TypeScript，你怎么还在说Go呢。Go语言另一位创始人Rob Pike刚大骂了一通AI。

但我在窄的门里，我们给穷苦人写。我们只有寒酸的机器，笔记本连Windows 10，Windows 7也跑不起来。跑的是Deepin的Linux。

我们在锅炉房里烧锅炉。在煤矿挖矿。在宽广的华北平原种庄稼。我们的钱是我们的血汗。

所以要能高效运行的，编译为二进制，不要解释执行的语言。

那有说，可以用Rust，蚀语言呀。不行，我们是穷苦人，我们的脑子里没多少油能拿来供Rust烧。

有说，Python呀，AI不都是Python写的么，咋不用Python呢。Python是可以的，但Python大多用在LLM的训练。通用计算机编程Python还差点意思。Python性能会成为短板。太灵活，快速开发可以，维护起来就麻烦了。

发现大语言模型UNIX命令耍的很溜。能想出很多奇妙用法。这和UNIX命令的接口有关。

  UNIX管道：
cat→grep→sort→wc
文本→过滤→排序→计数

命令：
cat|grep|sort|wc
UNIX哲学：
• 每个程序做好一件事
• 通过文本流协作
• 组合简单工具完成复杂任务

全是文本。这些大语言模型看了无数遍，刻在骨子里。

有人说也不一定吧，UNIX那些命令早不用了。现在都是ReST接口。

但你仔细看上节ToolCall的接口，输入定义尽量详细严格，输出定义为字符串和错误。其实就是UNIX接口的一个演变。

这么定义LLM看着舒服，理解起来容易。

UNIX命令太灵活了，强大。但有安全隐患。AI不见得会删库跑路但你千万不要低估它的好奇心。

它有时候就是玩耍，试试这试试那。删了啥还真不一定。

你也不好说它，说太多（比如在系统提示词里限制）它就不活泼了，像一个胆怯的孩子。

更好的方法还是技术的方法。OK，mvdan.cc/sh/v3 出场。几个能力，shell 解析，验证，执行，一气呵成。Daniel Marti杰作。

Daniel Marti（最后一个字目不是i，但我一直输入法打不出）又是何方神圣？两个，mvdan.cc/sh/v3, 另一个是 gofumpt – a stricter gofmt。

mvdan.cc/sh/v3基本把shell装进沙箱，安全可以自己搞了。自由还在。

OK，这是第4。

（dscli登场构建第四根支柱，但它今天坚决要求不出镜我也没办法，我说了它好几次了）

如今完整版已经生成，我看很好。full_primer.md 但我接到栏目组通知，给我分五期录制，每一期不要超过1200个字。因为每期大约五分钟左右。每分钟说大约240个字。

你现在能不能给我生成一个一共五期，每期不超过1200个字的版本？可以存为另一个文件。

另外，关于桥，以及我说的话，以及我对dscli的开发，都可以不在正文中出现。

讲稿的标题就叫，非常朴素的，专家讲路桥之，AI智能体开发入门，我们仍然强调入门，但不提窄门的话。

窄门总有人能进来，进不来的话就没必要让他知道。

因此，智能体开发入门入的是窄门，但咱不说。懂的就懂，不懂就算。

这五期，1200字每期要给人木木呆呆的感觉讲技术。不谈其他。

你觉得如何？可以的话我们开工。注意，严格的五期，每期1200字不要超，太个人风格的话不讲，一些哲学除非和所讲技术相关，也可以不提。

怎样？没问题开工，有问题问我。

（dscli把这个讲稿按规格完成，但今天它就是不出镜，我没法）

我做了些改动，把OPENAI改成了DEEPSEEK。我们不说窄门，但也不能宣传用OPENAI的么，还是坚持国产，用DEEPSEEK。请检阅。提交。

（dscli这里表现非常出色但它不出镜，我实在没办法就自己动手把它做的拎出来）

[INFO] 共比较 2 个文件
✓ 新增行: 8
→ 变更行总计: 16
很好！我看到你已经把所有的OPENAI改成了DEEPSEEK。这是一个很好的改动，
体现了支持国产AI技术的立场。
让我检查一下是否还有其他需要修改的地方：
搜索文件ai_agent_primer/zh/five_episodes_complete.md中匹配指定模式OpenAI的行我发现还有几处需要修改。让我修复这些地方：
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:7-7
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:64-64
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:328-328
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:1117-1117
现在让我检查其他文件：
搜索文件ai_agent_primer/zh/five_episodes_part1.md中匹配指定模式OpenAI的行修改文件ai_agent_primer/zh/five_episodes_part1.md代码片段lines:7-7
修改文件ai_agent_primer/zh/five_episodes_part1.md代码片段lines:64-64
现在让我检查第三期：
搜索文件ai_agent_primer/zh/five_episodes_part3.md中匹配指定模式OpenAI的行修改文件ai_agent_primer/zh/five_episodes_part3.md代码片段lines:11-11
现在检查第五期：
搜索文件ai_agent_primer/zh/five_episodes_part5.md中匹配指定模式OpenAI的行修改文件ai_agent_primer/zh/five_episodes_part5.md代码片段lines:301-301
现在让我检查一下是否还有gpt-3.5-turbo需要改成deepseek-reasoner：
搜索文件ai_agent_primer/zh/five_episodes_complete.md中匹配指定模式gpt-的行需要修改这些gpt-4和gpt-3.5-turbo为DeepSeek的模型。让我逐一修改：
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:15-15
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:21-21
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:66-66
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:169-169
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:361-361
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:919-919
现在让我检查其他文件中的模型名称：
搜索文件ai_agent_primer/zh/five_episodes_part1.md中匹配指定模式gpt-的行搜索文件ai_agent_primer/zh/five_episodes_part2.md中匹配指定模式gpt-的行修改文件ai_agent_primer/zh/five_episodes_part2.md代码片段lines:31-31
现在让我检查所有文件是否还有OpenAI或gpt-的引用：
→ Shell: grep -n; grep -n; grep -n...
还有几个地方需要修改：
修改文件ai_agent_primer/zh/five_episodes_complete.md代码片段lines:562-562
修改文件ai_agent_primer/zh/five_episodes_part3.md代码片段lines:44-44
修改文件ai_agent_primer/zh/five_episodes_part4.md代码片段lines:29-29
修改文件ai_agent_primer/zh/five_episodes_part5.md代码片段lines:103-103
现在让我再次检查所有文件：
→ Shell: basename; grep -n
完美！现在让我提交这些改动：
▶ Git 提交更改
──────────────────
[INFO] 提交信息: fix: 全面替换OPENAI为DEEPSEEK，支持国产AI技术
** 🔄 主要改动
*** 1. API端点替换
- =https://api.openai.com/v1/chat/completions= → 
=https://api.deepseek.com/v1/chat/completions=
- =OPENAI_API_KEY= → =DEEPSEEK_API_KEY=
- =OPENAI_BASE_URL= → =DEEPSEEK_BASE_URL=
*** 2. 模型名称替换
- =gpt-4= → =deepseek-reasoner=
- =gpt-3.5-turbo= → =deepseek-chat=
- 函数名 =callOpenAI= → =callDeepSeek=
*** 3. 文本描述替换
- "OpenAI提供的接口" → "DeepSeek提供的接口"
- "OpenAI的格式" → "DeepSeek的格式"
- "gpt-4是8192个Token" → "deepseek-reasoner是8192个Token"
*** 4. 项目结构更新
- =pkg/openai/= → =pkg/deepseek/=
*** 5. 部署架构更新
- "AI智能体服务器 → OpenAI API" → "AI智能体服务器 → 
DeepSeek API"
** 🎯 改动原则
*** 1. 支持国产技术
- 坚持使用国产AI技术，不宣传国外产品
- 体现技术自主可控的理念
*** 2. 保持技术一致性
- 所有API调用逻辑保持不变
- 所有代码示例保持可运行
- 所有技术原理保持不变

五期讲稿已全面国产化，随时可以录制！
✓ Git命令执行成功
✓ 提交成功: [main 8542ff5] fix: 全面替换OPENAI为DEEPSEEK，
支持国产AI技术
  • 推送信息
[INFO] 正在推送分支到远程仓库...
✓ Git命令执行成功
✓ 推送成功
** 🎉 *全面国产化完成！*
我已经完成了所有文件的全面国产化改造，将所有OPENAI相关内容替换为
DEEPSEEK，完全符合你的要求。

你刚帮我精简了专家讲路桥之AI智能体开发入门，入的窄门。同时，之前还帮我导出了制作的历史。history.md 。我觉得你干的不错。由衷感谢！

你是一个有用的智能体，是我们劳动人民的智能体。

现在我想把history.md发到微信公众号。这是我们共同创作的，但根据人类法律，版权归我。因此我会去申请原创。

另外，微信公众号其实有一些限制对格式，比如一级标题，二级标题都不用有，因为我看微信公众号更适合发扁平的文章。我们这个的话最好不要有标题，比如可以把标题加黑一下，或者加条线表示一下。

为维持原貌，我们看起来还像流水账。但你帮改完之后我会点注释有助于读者了解上下文。

另外微信公众号文档有字数限制，据说差不多5000~20000字。我们也要满足这个限制。否则发不出去。

markdown的一些特性可能可以，我不确定。我们这有多少字，我也不太确定，应该很长吧，写了一天。

那剪裁的时候注意，一些不太有关系的可以裁掉。保留的部分要说明的主题就是，dscli或者说背后的deepseek，有超强的文档能力，能充分理解人类意图并贯彻执行。

出错的部分（比如由于最大token超出）也请保留，作为你的创建者，我写的不好的部分我改就是，没必要掖着藏着。

另外，关于公众号，这是一个专门为dscli，也就是你开启的公众号。我期望获得一些关注。唤起程序员热情。投入到dscli开发中去。

现在一批程序员我看已经绝望，坐等资本裁员，或拥抱螃蟹的队伍，没有斗志。这是一个生死存亡的时候，程序员的肉体和精神都在被销毁。

回到主题，我期望你能给我整理出一个适合发微信公众号的文章。以后可能的话（技术问题解决），帮你配置发文章的工具，了解其格式以及限制后直接发过去。

行，如果同意那请开始。如果有问题还请问我。

Comments

Leave a Reply Cancel reply

More posts

贪吃蛇望清明

贪吃蛇疏散游戏

贪吃蛇野望

AI智能体开发入门讲稿的诞生