内容接要

  • 极简上手: 支持多任务和多模态学习,提供全面的配置验证功能
  • 高效性和可扩展性:自动选择最佳批量大小,提供参数高效微调
  • 专家级控制:提供超参数优化、模型可解释性分析以及丰富的指标可视化工具
  • 模块化和可扩展设计:极大地提升了模型开发的灵活性
  • 仓库地址:https://github.com/ludwig-ai/ludwig
  • 官网地址:https://ludwig.ai

核心优势

  • 极简上手:用户仅需使用一个声明式的 YAML 配置文件,即可轻松训练出最先进的 LLM 模型。Ludwig 支持多任务和多模态学习,并提供全面的配置验证功能,能够在运行前检测无效参数组合,避免错误发生。
  • 高效性和可扩展性:自动选择最佳批量大小,支持 DDP、DeepSpeed 等分布式训练策略,并提供参数高效微调(PEFT)、4 位量化(QLoRA)、分页和 8 位优化器等多种优化特性,即使面对超大规模数据集也能轻松应对。
  • 专家级控制: 用户可以完全掌控模型的各个方面,细致到激活函数的选择。同时,Ludwig 还提供超参数优化、模型可解释性分析以及丰富的指标可视化工具,满足专业开发者的需求。
  • 模块化和可扩展设计: 如同深度学习的“积木”,用户可以通过简单的参数调整尝试不同的模型架构、任务、特征和模态,极大地提升了模型开发的灵活性。
  • 面向生产环境: 提供预构建的 Docker 容器,原生支持在 Kubernetes 上使用 Ray 进行模型部署,并支持将模型导出至 Torchscript 和 Triton 等平台,以及一键上传模型至 HuggingFace。

主要功能

  • 训练和微调: 支持多种训练模式,包括对预训练模型进行完整的训练和微调。
  • 模型配置: 使用 YAML 文件进行配置,允许用户对模型参数进行详细定义,实现高度的可定制性和灵活性。
  • 超参数调整: 集成自动超参数优化工具,以增强模型性能。
  • 可解释的人工智能: 提供工具帮助用户深入了解模型决策,提高模型的可解释性和透明度。
  • 模型服务和基准测试: 简化模型服务的过程,并支持在不同条件下对模型性能进行基准测试。
  • Ludwig 的整体设计理念是简化 AI 模型的构建和部署流程,无论是 AI 领域的新手还是专家,都可以轻松上手,快速构建出适用于各种场景的定制化 AI 模型。

安装

  • PyPi 安装
    注意,Ludwig 需要 Python 3.8+。
pip install ludwig
  • 或者使用所有可选依赖项进行安装
pip install ludwig[full]

快速开始

  • 快速了解 基本功能,查看Colab Notebook 🚀 Open In Colab
  • Fine-Tune Llama-2-7b: Open In Colab
  • Fine-Tune Llama-2-13b: Open In Colab
  • Fine-Tune Mistral-7b: Open In Colab