一站式视频游戏爱好者应用
WebWalker是一个用于评估大型语言模型在网页遍历能力上的基准测试框架。
Oneconscious AI是一个致力于整合人类知识的人工智能平台。
一种通过文本迷宫解决任务来增强大型语言模型视觉推理能力的创新方法
Aria Gen 2 是一款用于机器感知、情境 AI 和机器人研究的新型智能眼镜。
一个关于大型语言模型(LLM)后训练方法的教程、调查和指南资源库。
UPDF AI 助力用户对 PDF 文档进行总结、翻译、解释、重写、构思,提升阅读效率。
一个开源文本转语音系统,致力于实现人类语音的自然化。
o1-pro 模型通过强化学习提升复杂推理能力,提供更优答案。
Project Aria 是 Meta 推出的以第一人称视角进行机器感知和增强现实研究的项目。
专为 AI 设计的 GPU 云平台,提供高性能基础设施和全天候支持。
OpenAI 提供的内置工具,用于扩展模型的能力,如网络搜索和文件搜索。
一个专注于整理最佳开源推理数据集的社区项目
FilmAgent是一个基于LLM的多智能体协作框架,用于虚拟3D空间中的端到端电影自动化制作。
基于聊天的AI简历生成器,快速创建ATS友好型简历,提升求职成功率。
一款支持多语言的智能会议笔记助手,可自动转录、总结并支持多种工具集成。
下一代原生GUI代理模型,能够无缝与图形用户界面交互。
一款能够自我进化的移动助手,专为复杂任务设计。
ChatGPT Gov是为美国政府机构设计的专门版本,用于访问OpenAI的前沿模型。
Deep Research 是 OpenAI 推出的一种新型智能研究工具,能够通过互联网进行多步骤复杂研究任务。
OpenAI Agents SDK 是一个用于构建自主智能体的开发工具包,简化多智能体工作流的编排。
提供超逼真的交互式虚拟形象,用于变革数字互动体验。
利用先进人工智能技术,将静态照片转化为浪漫接吻动画。
Kawara AI 是一款利用人工智能组织视频文件、快速查找所需片段的产品。
TransPixar 利用突破性的 AI 技术将文本转换为透明视频,彻底改变创意制作方式。
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
OmniHuman-1 是一种基于单张人像和运动信号生成人类视频的多模态框架。
VideoWorld是一个探索从无标签视频中学习知识的深度生成模型。
使用简单的提示和图像生成视频片段。
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
MM_StoryAgent 是一个多智能体框架,用于生成沉浸式故事视频。
首个面向语境智能的人类级实时交互系统,支持多情感、多风格语音交互。