关注人工智能领域的小伙伴们,想必多少都听过甚至体验过AI Agent构建平台的能力。这些平台不仅是智能体技术工具的承载平台,更是对于普通人来说的创新与想象力的孵化器,让我们每个人构建个性化智能体的能力,可以用最高效的方式去探索AI世界。
基于LLM的AI Agent构建平台承载了“人人都是开发者”的愿景与使命,真正拉开了全民开发的应用构建序幕,因此像Coze、Dify.ai、Beam.ai等也更受应用市场与资本市场的欢迎。此外,已经拿到融资的AI Agent项目也大多推出了AI Agent构建平台。
做AI原生应用平台的,基本上都属在AI赛道上的综合实力派,不光要上最强的大模型(规划能力、工具调用能力、代码生成能力要强),外围能力也要强,RAG的知识库、联网搜索、多模态输入输出,同时还要有吸引开发者的发布渠道,以及交互体验上对用户的足够丝滑。
但究竟AI Agent构建平台拥有哪些需要关注的特点?在构建智能体的过程中,我们又有哪些形式和产品可以选择?
本文通过盘点海内外80+ AI Agent构建平台,结合AI Agent产品的服务形态,与大家深入探讨下这些话题。
AI Agent的两种产品形态
目前市场上的To BTo C的AI Agent产品,主要包括两种产品形态:一种是直接打造出面向某些应用场景的AI Agent产品供用户使用,另一种则是通过打造一个AI Agent构建平台,让用户按需构建个性化AI Agent。
相对而言,前者能够实现开箱即用,可以更简单高效处理一些固定场景的业务流程自动化,但对于时时变化的应用环境就有些响应不够及时。而后者的特点是灵活性强,用户可以根据需求构建面向每一种业务场景的AI Agent,但构建起来需要一些成本,要求用户了解提示工程、工作流、知识库等的操作和技巧。
AI Agent平台型产品通常为了满足用户的个性化需求,在产品形态上会增加个性化构建,既有官方推出的标准化Agent产品,又能支持用户去构建个性化Agent。
很多AI Agent平台,本身就是一个基本自研或者开源架构的AI Agent。比如OpenAI的GPTs构建平台-GPT builder就是一个AI Agent,任何用户都可以使用自然语言构建各种GPTs而不需要输入代码,进一步降低了Agent构建门槛。
后来的很多类GPTs构建平台都是这个模式,并且在构建AI Agent的流程中的子流程中继续引入Agent,以在各个环节充分发挥代理的优势,让提示词结构化、数据库创建等流程都实现了自动化构建。并且,很多产品平台甚至都已实现通过一句话构建一个Agent的能力。
大部分Agent构建平台,基本的构建步骤都是输入Agent智能体的名字,输入一句话比如角色形容,再选择工具插件,就能快速构建一个Agent,比如豆包、移动端的千问。复杂一些的Agent,还包括了工作流、知识库、变量、数据库、触发器以及记忆设定等,这些进一步方便了开发者构建功能更强大的智能体,比如Coze.
在大家有一个基本认知后,下面详细说说AI Agent构建平台。
什么是AI Agent构建平台?
AI Agent构建平台是一种专门设计用于开发、定制和部署AI Agents的平台或工具集(框架),这些被构建的AI Agents\智能体\聊天机器人通常使用人工智能(正在普遍向大语言模型技术过渡)、机器学习和自然语言处理技术来理解和响应用户输入,自动执行复杂任务,或者提供有用的信息和服务。
这些平台具备一系列功能和特点,可以帮助开发者和企业创建能够执行特定任务或服务的智能系统。不同的AI Agent构建平台拥有不同的行业属性和不同的功能,但通常包含以下几个共同特点:
1. 无编码或低编码工具:允许用户通过图形界面和简单配置,而不是复杂的编程,来构建Agent。
2. 集成能力:与其他系统和服务的集成选项,例如CRM,数据库或API。
3. 自然语言理解:AI Agent需要能够解析自然语言,并从中理解用户意图。
4. 对话管理:构建流畅对话的工具,包括设置对话路径和根据上下文进行响应。
5. 训练和测试:平台提供数据集合工具来训练AI Agent,并且能够在实际情况或模拟环境中测试其性能。
6. 分析和优化:分析用户互动数据以改进AI Agent的回应和性能。
很多AI Agent构建平台被设计得易于使用,以便快速部署和轻松维护,也有一些面向具有更高技术技能和具体需求的开发者,提供更高级的定制选项和编程接口。
并且一些第三方AI Agent构建平台还支持多种大语言模型,给予用户更多的选择。这类平台旨在简化构建智能对话Agent的过程,让各种规模和类型的组织都能利用AI提升效率和用户体验。
如果是面向B端的企业级AI Agent构建平台,就需要更多的功能和特性,总结如下:
- 可视化界面:提供拖放界面,允许用户通过图形化方式设计Agent的工作流程和逻辑。
- 预定义模板:包含多种预设的模板和场景,以便快速启动常见类型的AI应用开发。
- 自定义Prompt编写:允许开发者编写自定义的Prompt来定义Agent的人设、行为和对话流程。
- 插件扩展:支持第三方或自定义插件,以增强Agent的功能,如集成特定的数据库或API。
- 工作流设计:通过流程图或脚本化的方式编排Agent的任务执行顺序和逻辑。
- 对话管理:集成对话管理系统,使Agent能够进行自然语言处理和对话。
- 机器学习和模型训练:提供机器学习工具,允许开发者训练和优化Agent的决策模型。
- 测试和模拟:允许在安全的环境中测试Agent的性能,模拟不同的交互场景。
- 部署和监控:支持将开发完成的Agent部署到不同的环境,并提供监控和分析工具。
- 用户和权限管理:提供用户管理功能,允许控制对Agent构建平台的访问权限。
- 多语言支持:支持多种语言,使AI Agent可以服务于不同语言的用户群体。
- 可扩展性:设计平台支持扩展,能够随着业务需求的变化而进行扩展和升级。API集成:提供API接口,方便将AI Agent与现有的IT系统或第三方服务进行集成。
- 社区和文档:提供详细的文档、开发者社区和支持,帮助用户更好地使用平台。
AI Agent构建平台的目标是简化AI应用的开发过程,使其更加高效和易于管理,同时提供足够的灵活性以满足不同业务场景的需求。通过这些平台,企业可以快速构建能够提升用户体验、优化业务流程和提高运营效率的智能体。
两种AI Agent构建形式
一、Prompt与插件结合的方式
使用prompt定义Agent人物特性与行为模式,再结合各种插件来强化和扩展功能,是当前的主流智能体开发策略,典型代表就是OpenAI的GPTs。现在市面上的类GPTs产品比如Coze、文心智能体等,都是用这种方式实现Agent开发。
Coze Bot构建页面
其优势在于搭建过程的高效性,开发者仅需要输入大致主题方向,平台就可以根据这个主题自动生成一套全面且详尽的人物设定和行为Prompt,极大地提升开发的速度和便捷性。不足之处在于它难以应对逻辑复杂且对稳定性有较高要求的任务流程。在面对这类任务时,可能无法满足需求。
二、基于workflow的工作流构建方式
通过流程图来详细编排Agent的工作流程,是一种更为结构化且清晰的Agent构建方法。Voiceflow和Dify.AI都是这种方式代表性产品。这种开发方式的主要优势在于能够设计出非常复杂且庞大的工作流程,利用意图跳转、条件分支(if/else逻辑)、循环等逻辑结构,可以构建出企业内部非常复杂且精细的业务流程。
一个合格而强大的AI Agent构建平台,需要全方位考虑各层面用户的需求。所以很多基于第一种形式的产品也会加入第二种形式作为补充,比如coze也引入了工作流构建方式,并且在多智能体构建中体现了全面的产品交互,Dify.AI则提供了从Agent构建到AI workflow编排的能力。
吴恩达近期在红杉资本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、规划(Planning)、多智能体协作(Multiagent collaboration)等四种AI agent设计模式,已经逐步在一些Agent构建平台实现,比如Coze等已经能够支持全部四种设计模式。
事实上,AI Agent构建平台现在已经是一个泛在概念。很多AI应用构建平台虽然没有标榜AI Agent构建,但在LLM应用越发普及的当下,这些平台基本具备了构建AI Agent的能力。还有企业服务领域的CRM、ERP、低代码、RPA等厂商,也在原有产品生态的基础之上逐步推出了AI Agent/AI应用构建平台,通常这些产品被称作AI\AI Agent构建器(AI\AI Agent Builder)。
国内19个AI Agent构建平台
大语言模型正在Agent化,一方面大模型都在推出集成插件的“可执行能思考”的Chatbot版本,另一方面Agent构建平台正在成为大语言模型厂商的产品标配。
国内目前的构建平台主要以大型科技公司的产品为主,百度、字节跳动、阿里巴巴、科大讯飞等大语言模型的厂商都推出了AI Agent构建平台,其中字节跳动、阿里巴巴等厂商也基于企业办公系统推出了相关的Agent构建平台。比如智谱推出了智谱清言。Kimi推出了Agent产品kimi+,预计后面也会推出Agent构建平台。AI Agent构建平台相关的创业项目,也正在快速上新。
本文整理了19个国内AI Agent构建平台,如下:
特别注意,国内很多AI Agent项目也主打Agent构建平台,只是有些是To B项目无法体验,还有些处在项目早期目前尚无法体验。