Logo

pdf2htmlex-精准将pdf转换成html

将 PDF 转换为HTML而不会丢失文本或格式。项目仓库:https://github.com/pdf2htmlEX/pdf2htmlEX。主要特性:生成原生的HTML,其中字体和元素位置与pdf一样精准。灵活输出:支持所有内容生成在单个HTML文件中;也支持分页生成多个html文文件。...

视频剪辑的重磅AI神器:FunClip

内空摘要基于阿里巴巴通义实验室自研并开源的FunASR工具包集成了阿里巴巴开源的工业级模型Paraformer-Large集成了SeACo-Paraformer的热词定制化功能,提升识别效果集成了CAM++说话人识别模型,自动识别出的说话人ID支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段...

英文视频转成中文:EasyVideoTrans

主要内容功能强大、使用便捷的AI免费工具轻松将英文视频转成中文操作流程简单明了在线Demo:https://easyvideotrans.com/playground前端项目:https://github.com/sutro-planet/easyvideotrans-frontend后端项目:ht...

Glyph-ByT5-v2多语言高精度文字海报

微软亚洲研究院、清华大学、北京大学、利物浦大学联合推出渲染高视觉美感文本惊艳海报,效果媲美DALL-E3支持10种不同语言的准确视觉文本渲染项目仓库:https://github.com/AIGText/Glyph-ByT5...

Pinokio:一键安装开源 AI 应用

主要内容整合了几乎所有市面上开源的 AI 工具傻瓜式地一键安装AI 工具支持全平台:Windows、Mac、Linux官网:https://pinokio.computer项目仓库:https://github.com/pinokiocomputer/pinokio...

Ludwig低代码框架,简化大模型微调

内容接要极简上手: 支持多任务和多模态学习,提供全面的配置验证功能高效性和可扩展性:自动选择最佳批量大小,提供参数高效微调专家级控制:提供超参数优化、模型可解释性分析以及丰富的指标可视化工具模块化和可扩展设计:极大地提升了模型开发的灵活性...

mem0ai 适配ollama

适配ollamamem0最近非常红火,短短几天功夫,github上的星就飙到了16.9K。官方文档中有OpenAI的例子,但是对于同样风头正盛的ollama,却没有相关的例子。,检查了下项目仓库中的代码,发现ollama适配工作并未完成。于是自己动手丰衣足食,花了点功夫,适配了ollama。...

LitGPT:预训练、微调及部署神器

快速、高效的使用、微调、预训练和部署大型语言模型集20+款高性能大型语言模型于一体无抽象层:所有模型都是从头开始实现的,没有抽象层,提供了完整的控制能力。开发者友好:易于调试,实现简单,单文件实现。优化性能:设计用于最大化性能,降低成本,加快训练速度。项目地址: https://github.com...

DeepSeek-Chat-V2.1开源

[DeepSeek-Chat-V2.1开源 ]模型更新,拥有 236B 参数,具有 128K 上下文在通用排行榜和编程竞技场排行榜上表现依然非常优秀性能提升,在竞技场硬核基准测试中提高了26.7分开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-...

LibrePhotos: 开源照片管理服务平台

ELibrePhotos: 开源照片管理服务平台灵活的照片组织,支持按标签、日期、相册组织照片智能搜索功能,通过关键词快速定位照片共享和协作,轻松地分享照片,并进行合作编辑项目地址:https://github.com/LibrePhotos/librephotos...