AI项目和框架 - 第 48 页

Kandinsky 5.0

Kandinsky 5.0 是俄罗斯 AI 研究实验室 AI-Forever 开发的文本到视频生成模型，具有强大的生成能力和高效的性能表现。核心版本 Kandinsky 5.0 Video Lite 是...

阅读原文

AI工具

8个月前

SongBloom

SongBloom 是腾讯 AI Lab 开发的全长度歌曲生成框架，结合了自回归草图绘制和基于扩散的细化技术，通过交错生成范式（Interleaved Generation）交替生成语义...

阅读原文

AI工具

8个月前

MAI-Image-1

MAI-Image-1是微软推出的首款自研图像生成式AI模型。模型以“创作者导向”为核心设计理念，擅长生成逼真的自然光照效果和复杂场景图像，如闪电、风景等。与一些...

阅读原文

AI工具

8个月前

Youtu-Embedding

Youtu-Embedding 是腾讯优图实验室开源的面向企业级应用的通用文本表示模型。模型通过大规模语料训练和创新的微调框架，具备强大的语义理解能力，能胜任文本...

阅读原文

AI工具

8个月前

Ring-1T

Ring-1T是蚂蚁集团开源的万亿参数思考大模型，基于 Ling 2.0 MoE 架构，在 20T 语料上预训练，通过自研强化学习系统 ASystem 进行推理能力训练。支持128k上下...

阅读原文

AI工具

8个月前

SAIL-VL2

SAIL-VL2 是抖音团队和新加坡国立大学联合开发的开源视觉语言基础模型，专注于多模态理解和推理。由视觉编码器 SAIL-ViT、视觉-语言适配器和大语言模型组成，...

阅读原文

AI工具

8个月前

nanochat

nanochat是AI领域专家Andrej Karpathy发布的开源项目，以极低成本和高效流程训练小型语言模型，实现类似ChatGPT的对话功能。仅需约100美元（使用8张H100 GPU...

阅读原文

AI工具

8个月前

Get Jobs

Get Jobs是开源的自动化简历投递工具，能帮助用户高效地在多个招聘平台（如Boss直聘、猎聘、拉勾、51job、智联招聘等）上投递简历。

阅读原文

AI工具

8个月前

LLaVA-OneVision-1.5

LLaVA-OneVision-1.5 是开源的多模态模型，通过高效训练和高质量数据实现高性能、低成本和强复现性。采用自研的 RICE-ViT 作为视觉编码器，结合 2D 旋转位置...

阅读原文

AI工具

8个月前

MineContext

MineContext 是字节跳动开源的主动式上下文感知 AI 工具，通过挖掘数字生活中的“方块”，帮助用户高效管理知识和信息。每 5 秒截取一次屏幕，经过处理后，批量...

阅读原文

AI工具

8个月前

NeuTTS Air

NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS（文本到语音）模型。具备高拟真语音合成能力，声音自然流畅，几乎能以假乱真。支持本地运行，提供 ...

阅读原文

AI工具

8个月前

Paper2Video

Paper2Video 是新加坡国立大学 Show Lab 开发的项目，从学术论文自动生成演示视频。通过 PaperTalker 多智能体框架，将论文转化为包含幻灯片、字幕、语音和演...

阅读原文

AI工具

8个月前

KAT-Dev-72B-Exp

KAT-Dev-72B-Exp 是快手推出的开源编程专用大语言模型，参数规模达720亿。模型是 KAT-Coder 的强化学习版本，专为软件工程任务设计。

阅读原文

AI工具

8个月前

Qwen3-VL Cookbooks

Qwen3-VL Cookbooks 是阿里推出的为 Qwen3-VL 模型设计的实用指南集合，帮助用户快速掌握和应用该模型的各种功能。集合涵盖多种能力的使用示例，包括物体识别...

阅读原文

AI教程

8个月前

Androidify

Androidify 是谷歌推出的一个开源项目，帮助开发者学习如何在 Android 上构建 AI 驱动的应用。项目使用了谷歌最新的技术，如 Jetpack Compose、Gemini API（...

阅读原文

AI工具

8个月前