标签:多语言支持

HippoRAG 2

HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank...
阅读原文

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码...
阅读原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升级版 AI 视频生成工具,基于深度学习技术,能将图片或文字提示转化为高质量的视频内容。与前代版本相比,Pika 2.2 在功能和性...
阅读原文

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型语言模型,是目前规模最大、性能最强的聊天模型。基于扩展无监督学习,提升模式识别、知识广度和创意生成能力,减少了幻觉...
阅读原文

3FS

3FS(Fire-Flyer File System)是DeepSeek推出的高性能分布式文件系统,专为AI训练和推理任务设计。3FS用现代SSD和RDMA网络技术,基于分离式架构聚合数千个SS...
阅读原文

R1-Onevision

R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在数学...
阅读原文

Phi-4-Mini

Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型,参数量为 38 亿。基于密集的解码器-only Transformer 架构,结合分组查询注意力(G...
阅读原文

IndexTTS

IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合了 GPT 风格的生成技术,能将文本高效转化为自然流畅的语音...
阅读原文

All Voice Lab

All Voice Lab(趣丸千音)是全球领先的AI语音创作平台,提供一站式智能语音解决方案,基于趣丸科技与香港中文大学(深圳)联合研发的MaskGCT语音大模型开发...
阅读原文

Dreamona

Dreamona 是 AI 视频生成工具,用户基于简单的文字描述或上传图片,快速生成高质量的动态视频。Dreamona 支持多种视频风格,从现实主义到创意动画,满足不同...
阅读原文

olmOCR

olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里...
阅读原文

Flame

Flame是开源的多模态AI模型,支持将UI设计截图转换为高质量的现代前端代码。Flame基于视觉语言建模、自动化数据合成和结构化训练流程,生成符合React等现代前...
阅读原文

Gemini Code Assist

Gemini Code Assist 是 Google 推出的 AI 编程工具,能帮助开发者更高效地编写代码、提升代码质量。Gemini Code Assist 基于 Gemini 2.0 模型,支持所有公开...
阅读原文

元镜

元镜是基于人机共生引擎的AI视频创作系统,支持从创意灵感到成品视频实现高效创作。元镜基于自动化脚本生成、角色风格统一、多模态融合和智能工作流等功能,...
阅读原文

LazyLLM

LazyLLM 是开源的低代码平台,帮助开发者快速、低成本地构建多智能体大语言模型应用。通过极简的开发流程,支持一键式部署和跨平台操作,降低了 AI 应用开发...
阅读原文
1141516171861