分享使用openclaw以及最近自己开发的 TAKO (Korde-AI/tako) 进行部署自己的工作流这段时间有一些感悟,发现和实践, 这已经是两周以来第一次试图给人类输出些什么有营养东西了(ai的坏处+1
首先附上一张来自https://skillsbench.ai/的图片:

它主要讲了现在类似openclaw这种system的一些抽象层,大概就是cpu是大模型; openclaw https://github.com/openclaw/openclaw/tree/main/src 或者 https://github.com/Korde-AI/tako/tree/main/src 中的内容属于操作系统层面,负责调度 agent、管理工具和 I/O以及怎么load skill之类的,类似于我们拿到了一台 搭载m5芯片的装了macos26的macbook
拿到电脑之后我们需要给他按照我们的需求安装各种application,这就是skils
到这里都不是什么magic的部分
真正magic的部分是
cpu是完全了解操作系统且可以和user进行对话, 记住user偏好的: 只要成功部署好openclaw之类的成功进行对话,那么接下来就可以无限用自然语言创造agent, 创造skills, 更改权限和配置,“只要这台电脑跑起来就没有很陡峭的学习曲线”(siri本身都没有很好做到这一点)


b. 当然这个背后其实就是把项目本身的各种doc cmd开放给agent让它可以看到且可以使用,至于记住user偏好这个点我们之前的agent都有这个功能所以暂时不赘述
skill机制的可塑性非常强:目前这种agentos的核心就是允许user用类似Minecraft中工作台一样的规则造东西(甚至造新的工作台)。
比如可以创建其他agent

比如创建一个专属skill用来拯救我的语言障碍

支持各种channel:同时其实支持channel本身我们也可以把它看成是skill,我们自己可以创建skill来链接到任何工作流 (只要这个channel是允许的)
因此,最基本的直觉是:当 CPU (基础模型)足够强大,而操作系统 (agent harness)又保持高度抽象与开放时,这个平台本身就会变成一种“通用创造环境”,几乎任何东西都可以在其之上被构建出来。(真开放世界
当然现在也已经出现了各种方便的加载别人的agent配置下载别人的skill的行为, 未来这种“加mod”式玩法也必然成为生态让大家能够克隆和分支别人的开放世界
所以动手能力比较强的小伙伴就会发现openclaw的百万行代码有些冗余了, 其实只需要add agent, find-skill, add-skill 最多再加个audit-skill 就可以创造出任何自己想做的东西了(skill 不只是md文件说明,也是可以包括可以plugin的代码的), 所以基建狂魔如我就自己写了 Korde-AI/tako 来实现自己最基本的“工作台”需求并且更方便进行修改 。
一定要试试使用discord,创建discord server 然后在server中和你的首席agent (也就是你绑定的第一个agent) 对话来创建更多的channel和agent,使用discord主要原因是agent可以拥有开放channel thread 的权限方便监督各种subagent任务以及更好区分不同的workspace, 也可以自由自在上传attachment,因为对于超长的agent输出比如log之类的不用attachment会被刷屏观感极其差
(当然也可以vibecode一个类似的dashboard来进行track,但是
如果你正在使用其他channel与openclaw或者tako进行对话比如tg,可以直接和他对话问他 我想把你添加到discord应该怎么做
添加之后就可以继续直接和这个agent进行对话定义他的各种行为
我的工作区belike⬇️

使用discord的另一个好处在于可以直接把其他coauthor拉进某个project discord 来进行多人协作(这样就可以很多人一起被ai使用了,大大减少心智负担)但是前提是你的gateway部署在比较安全的环境,或者合作者或者agent的权限有限,不然其他人可以获得服务器上任何东西 (tg group也可以 但是需要手动创建和配置group不太适合懒人)
不要在最开始就创建一大堆bot, agent分为两种,一种是可以直接对话的可以看得到的agent, 这个需要绑定和配对到tgbot或者discord app,是需要token的。另外一种是没有绑定的subagent,但是这些也可以直接被我们能看到的agent进行调用,所以并不需要一下子创建和绑定一大堆bot,最后bot和bot之间的界限会越来越模糊
给不同的project组织专属的工作空间和channel,以及管理项目进度,
可以调用一些subagent比如coding agent或者literature review agent (这些可以不绑定bot 直接让pm agent创建和当作subagent调用)之类的,也可以调用本地的claude code, codex等, 这些都可以通过告诉他在后台挂起或者启动一个新的thread来不影响当前的聊天 , 比如下面是我调用claude code在写完全不同的三个需求

注意,调用codex,claude code,gemini cli 等等其实都可以视为 agent 的skills, 这也是为什么说可以无限套娃拓展
可以直接把创建project这个写成一skill (当然不需要自己写,和agent说他会自己使用create skill这个skill), 比如我是这样描述的

然后还可以加一些骚操作比如, 创建或下载一个访问和同步overleaf的工具(这个直接问他我想实现这个功能应该怎么做agent会自己给你意见的)给他一些访问权限访问你的其他机器上, 他就可以把现在的所有代码和paper拉取到一个一个workspace中:

skil 不是越多越好 不要在一开始就安装一大堆skill, 除了安全风险其实也会让agent非常困惑,并且skill包含了skill作者的使用习惯, 所以最好的办法就是通过自己最经常的使用把它培养成自己喜欢的样子, 建造游戏自己建造才比较有趣
比如每个人都有自己喜欢的信息获取渠道,只有告诉agent我喜欢从哪里获取信息希望看到什么格式并且让他把这个写成skill, 才可以真的获得对自己胃口的日报周报
