Logo

分类:llm

16 篇文章

视频剪辑的重磅AI神器:FunClip

内空摘要基于阿里巴巴通义实验室自研并开源的FunASR工具包集成了阿里巴巴开源的工业级模型Paraformer-Large集成了SeACo-Paraformer的热词定制化功能,提升识别效果集成了CAM++说话人识别模型,自动识别出的说话人ID支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段...

英文视频转成中文:EasyVideoTrans

主要内容功能强大、使用便捷的AI免费工具轻松将英文视频转成中文操作流程简单明了在线Demo:https://easyvideotrans.com/playground前端项目:https://github.com/sutro-planet/easyvideotrans-frontend后端项目:ht...

Glyph-ByT5-v2多语言高精度文字海报

微软亚洲研究院、清华大学、北京大学、利物浦大学联合推出渲染高视觉美感文本惊艳海报,效果媲美DALL-E3支持10种不同语言的准确视觉文本渲染项目仓库:https://github.com/AIGText/Glyph-ByT5...

Ludwig低代码框架,简化大模型微调

内容接要极简上手: 支持多任务和多模态学习,提供全面的配置验证功能高效性和可扩展性:自动选择最佳批量大小,提供参数高效微调专家级控制:提供超参数优化、模型可解释性分析以及丰富的指标可视化工具模块化和可扩展设计:极大地提升了模型开发的灵活性...

mem0ai 适配ollama

适配ollamamem0最近非常红火,短短几天功夫,github上的星就飙到了16.9K。官方文档中有OpenAI的例子,但是对于同样风头正盛的ollama,却没有相关的例子。,检查了下项目仓库中的代码,发现ollama适配工作并未完成。于是自己动手丰衣足食,花了点功夫,适配了ollama。...

LitGPT:预训练、微调及部署神器

快速、高效的使用、微调、预训练和部署大型语言模型集20+款高性能大型语言模型于一体无抽象层:所有模型都是从头开始实现的,没有抽象层,提供了完整的控制能力。开发者友好:易于调试,实现简单,单文件实现。优化性能:设计用于最大化性能,降低成本,加快训练速度。项目地址: https://github.com...

DeepSeek-Chat-V2.1开源

[DeepSeek-Chat-V2.1开源 ]模型更新,拥有 236B 参数,具有 128K 上下文在通用排行榜和编程竞技场排行榜上表现依然非常优秀性能提升,在竞技场硬核基准测试中提高了26.7分开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-...

SmolLM:性能炸裂碾压一众竞品

SmolLM:性能炸裂碾压一众竞品Hugging Face发布完全开源的小型语言模型参数量从 135M 到 1.7B 不等可以在手机上流畅运行打败了99%的对手官方介绍:https://huggingface.co/blog/smollm...

Chameleon:全球首个混合生成图文的模型

Chameleon:全球首个混合生成图文的模型由Meta公司FAIR团队研发的多模态模型能够理解和生成任意序列的图像和文本在长篇混合模式生成评估中,匹配或超越了包括Gemini Pro和GPT-4V在内的更大模型的性能项目仓库:https://github.com/facebookresearch/...

Mem0 AI:开源一天斩获万星

Mem0 AI:开源一天斩获万星超越 RAG,为LLM、Agent添加超强个性记忆多层次的记忆:它能记住用户的偏好、过去的交互、事情的进展,就像你跟朋友聊天,朋友能记住你喜欢什么、不喜欢什么自适应的个性化:从交互中持续学习,越用越聪明,真是个贴心的小助手跨平台、API 友好:支持私有化部署,开发者可...