小众AI

AutoAgent
AutoAgent - 香港大学开源的AI智能体框架
由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。
  官网   代码仓

AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。该框架支持多种大语言模型(LLM),如Grok、Gemini等,并具备高性能的多智能体协作系统,在GAIA基准测试中表现优异,媲美OpenAI的Deep Research。AutoAgent不仅操作简单,还提供文件上传、命令行交互等功能,适合开发者、非技术用户甚至研究人员使用。目前,它正在开发Web界面和更多工具集成,未来潜力巨大。

主要功能

  • 自然语言创建智能体:通过文字描述需求,自动生成专属AI智能体,无需代码。
  • 多智能体协作系统:内置开箱即用的多智能体模式,支持复杂任务分解与协作。
  • 支持多种LLM模型:兼容OpenAI、Deepseek、Grok等多种大语言模型,灵活切换。
  • 文件上传与数据交互:支持上传文件(如图像、PDF等),增强数据处理能力。
  • 命令行交互界面:提供CLI模式,方便用户直接输入请求并获取结果。
  • 高性能任务处理:在GAIA基准中表现卓越,效率媲美付费AI工具。
  • 工作流编辑器:通过自然语言设计智能体协作流程,简化复杂任务管理。

安装和使用

1. 准备环境

  • 安装Python:确保系统安装了Python 3.10或以上版本,可在Python官网下载安装。
  • 安装Git:用于克隆AutoAgent代码库,访问Git官网下载并安装。
  • 安装Docker:AutoAgent使用Docker容器化运行环境,前往Docker官网安装Docker Desktop(Windows/Mac)或Docker Engine(Linux)。

2. 克隆代码库

打开终端(Windows用户可用CMD或PowerShell,Mac/Linux用户用默认终端),输入以下命令克隆AutoAgent仓库:

复制复制复制复制复制复制复制

git clone https://github.com/HKUDS/AutoAgent.git  
cd AutoAgent

3. 安装依赖

在AutoAgent目录下,运行以下命令安装必要的Python依赖:

pip install -e .

这将安装AutoAgent所需的所有库,确保网络畅通以完成下载。

4. 配置环境变量

  • 创建一个.env文件,复制仓库中的.env.template并重命名为.env

  • 编辑.env文件,填入必要的API密钥。例如: 复制复制复制复制复制

    GITHUB_AI_TOKEN=your_github_token  
    OPENAI_API_KEY=your_openai_key  
    XAI_API_KEY=your_xai_key
    
    • GITHUB_AI_TOKEN是必需的,可在GitHub个人设置中生成。
    • 其他API密钥根据你想使用的模型选择性填写(如OpenAI、Deepseek等)。

5. 启动Docker镜像

运行以下命令拉取预构建的Docker镜像:

docker pull tjbtech1/AutoAgent:latest

镜像会根据你的系统架构自动适配(AMD64或ARM)。

6. 启动AutoAgent

在终端中运行以下命令启动CLI模式:

auto main

启动后,你将进入AutoAgent的命令行界面,可以开始使用。

实战演习

场景1:通过自然语言创建智能体

  • 操作步骤:

    1. 启动CLI后,输入agent editor进入智能体编辑模式。
    2. 输入需求描述,例如:“创建一个能分析PDF文档并总结内容的智能体。”
    3. 系统会自动生成智能体配置文件并询问是否需要调整工具(如文件读取工具)。
    4. 输入create确认创建,智能体即可使用。
  • 示例:输入“帮我分析销售数据的PDF并生成报告”,AutoAgent会自动配置一个支持PDF解析和报告生成的智能体。

场景2:多智能体协作任务

  • 操作步骤:

    1. 启动后输入user mode,进入多智能体模式。
    2. 输入任务,如:“研究某产品的市场趋势并给出建议。”
    3. 系统会分解任务,自动分配给多个智能体(搜索、分析、总结等),并输出结果。
  • 示例:输入“分析2025年AI趋势”,AutoAgent会通过搜索智能体收集数据,分析智能体整理信息,最后生成完整报告。

场景3:文件上传与处理

  • 操作步骤:

    1. 在CLI中输入upload 文件路径,如upload ./sales.pdf
    2. 输入任务,如:“总结这个PDF的内容。”
    3. 智能体会读取文件并返回总结结果。
  • 注意:支持多种格式(PDF、图像、文本等),文件名不要包含空格。

场景4:设计工作流

  • 操作步骤:

    1. 输入<a href="https://www.aisharenet.com/workflow/">workflow</a><span> </span>editor进入工作流编辑模式。
    2. 输入流程描述,如:“先搜索资料,再分析数据,最后生成图表。”
    3. 系统会生成工作流配置,输入run执行任务。
  • 示例:输入“搜索AI论文,提取关键点,生成可视化图表”,AutoAgent会按步骤完成并输出结果。


更多...


wdoc
一个功能强大的 RAG(检索增强生成)系统,旨在汇总、搜索和查询各种文件类型的文档。
ai-financial-agent
探索人工智能在投资研究中的应用。
Meetily
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。