AI项目和框架

NarratoAI

NarratoAI 是基于AI技术自动化影视解说和编辑的工具。通过大型语言模型(LLM)理解视频内容,自动生成解说文案,并将文案转化为配音,同时进行视频剪辑和字幕...
阅读原文

Skywork-Reward

Skywork-Reward 是昆仑万维推出的一系列高性能奖励模型,包括 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。主要用于指导和优化大语言模型的...
阅读原文

Torch-MLU

Torch-MLU 是寒武纪开源的 PyTorch 设备后端扩展插件,支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端使用。插件实现了对 PyTorch 的原生支...
阅读原文

ImageBind

ImageBind是Meta公司推出的开源多模态AI模型,将文本、音频、视觉、温度和运动数据等六种不同类型的信息整合到一个统一的嵌入空间中。模型通过图像模态作为桥...
阅读原文

LlamaCoder

LlamaCoder 是一个开源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全栈应用程序。旨在提供一种替代 Claude Artifacts 的解决方案。集成了 Sandpack、Next....
阅读原文

XVERSE-MoE-A36B

XVERSE-MoE-A36B是由元象推出的中国最大的MoE(Mixture of Experts,混合专家模型)开源大模型。模型具有2550亿的总参数和360亿的激活参数,性能上与超过100B...
阅读原文

PyVideoTrans

PyVideoTrans 是开源的视频翻译配音工具,将视频内容从一种语言自动翻译成另一种语言,并添加相应的字幕和配音。PyVideoTrans支持多语言,具备高效的语音识别...
阅读原文

LongCite

ongCite是由清华大学推出的项目,旨在提升大型语言模型(LLMs)在长文本问答任务中的可信度和可验证性。项目通过生成细粒度的句子级引用,使用户能验证模型的...
阅读原文

CSGO AI

CSGO(Content-Style Composition in Text-to-Image Generation)是由南京理工大学、小红书等机构合作开发的图像风格迁移和文本到图像生成的研究项目。CSGO的...
阅读原文

GameGen-O

GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型,专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能,包括生成游戏角色、动...
阅读原文

SleepFM

SleepFM 是斯坦福大学开源的多模态睡眠分析模型,基于超过14,000名参与者的100,000小时睡眠数据,通过融合大脑活动、心电图和呼吸信号,提供全面的睡眠健康评...
阅读原文

书生·筑梦2.0(Vchitect 2.0)

书生·筑梦2.0(Vchitect 2.0)是由上海人工智能实验室推出的升级版视频生成开源大模型,旨在生成符合中国文化和东方审美的视频内容。模型支持长达20秒的视频...
阅读原文

AI Youtube Shorts Generator

AI Youtube Shorts Generator 是一款开源的 AI 视频编辑工具,基于 GPT-4、FFmpeg 和 OpenCV 等技术自动分析长视频,提取最精彩的片段,将其裁剪成适合短视频...
阅读原文

PhotoPrism

PhotoPrism 是一个开源的AI照片管理工具,用 Go 语言编写,旨在为用户提供一个去中心化的照片存储和组织解决方案。支持用户在自己的硬件上运行,完全控制自己...
阅读原文

Claude Dev

Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,为开发者提供自动化的编程支持。Claude Dev自动处理...
阅读原文
19293949596115