AI项目和框架

NEXUS-O

NEXUS-O 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型，能实现对语言、音频和视觉信息的全方位感知与交...

阅读原文

AI工具

1年前 (2025)

OWL

OWL（Optimized Workforce Learning）是基于CAMEL-AI框架开发的多智能体协作系统，通过智能体之间的动态交互实现高效的任务自动化。通过角色分配和任务分解，...

阅读原文

AI工具

1年前 (2025)

TicVoice 7.0

TicVoice 7.0 是出门问问推出的第七代高品质 TTS（语音合成）引擎，基于新一代语音生成模型 Spark-TTS 。TicVoice 7.0基于创新的 BiCodec 编码方式，将语音分...

阅读原文

AI工具

1年前 (2025)

GEN3C

GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型，基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存...

阅读原文

AI工具

1年前 (2025)

Mercury Coder

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型（dLLM），是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...

阅读原文

AI工具

1年前 (2025)

SuperGPQA

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖...

阅读原文

AI工具

1年前 (2025)

SpeciesNet

SpeciesNet 是 Google 开源的人工智能模型，通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成，能识别超过 2000 种标签，包括动物...

阅读原文

AI工具

1年前 (2025)

GaussianCity

GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架，基于3D高斯绘制（3D-GS）技术。引入紧凑的 BEV-Point 表示方法，将场景的显存（VRA...

阅读原文

AI工具

1年前 (2025)

Asyncflow v1.0

Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项，能为文本内容生成高质量的语音朗读，适用于多种语言和风格。

阅读原文

AI工具

1年前 (2025)

NextGenAI

NextGenAI是OpenAI推出的全球性联盟，基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构，Ope...

阅读原文

AI工具

1年前 (2025)

NotaGen

NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型，基于模仿大型语言模型（LLM）的训练范式生成高质量的古典乐谱。NotaGen 基于...

阅读原文

AI工具

1年前 (2025)

DiffRhythm

DiffRhythm 是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包含人声和伴奏的完整...

阅读原文

AI工具

1年前 (2025)

OmniAlign-V

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型（MLLMs）与人类偏好的对齐能力设计的高质量数据...

阅读原文

AI工具

1年前 (2025)

TrendPublish

TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集，从 Twitter/X、网站等渠道获取信息，用 DeepseekAI、千问等 AI 服务进行智能总结、关...

阅读原文

AI工具

1年前 (2025)

Proxy Lite

Proxy Lite 是开源的轻量级视觉语言模型（VLM），参数量为3B，支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器，完成网页交互、数据抓取、表单填写等...

阅读原文

AI工具

1年前 (2025)

1…104 105106107 108…196