Pixel Reasoner

Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理能力。
阅读原文

VideoTutor

VideoTutor是AI教育辅助工具,生成动画讲解视频,帮助学生理解知识点和解题过程。VideoTutor支持SAT数学、AP数学、STEM知识和语言学习等学科领域。
阅读原文

SurfSense

SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Notion、YouTube、GitH...
阅读原文

Vid2World

Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基于视...
阅读原文

VibeNecto

VibeNecto是AI营销视觉素材生成平台。能根据用户输入的文本描述,快速生成高质量的定制化图片,适用于社交媒体、广告等多种营销场景。用户无需专业设计技能,...
阅读原文

Gemini Diffusion

Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion...
阅读原文

JoyAgent智能体平台

JoyAgent智能体平台是京东云推出的企业级一站式AI智能体搭建与发布平台。平台聚合大模型、知识库、插件和工作流等能力,支持低代码开发,用户无需复杂编程用...
阅读原文

EmoxCare

EmoxCare是免费的AI心里咨询师,帮助用户进行心理健康管理。用户可以通过文字、语音消息等方式与EmoxCare进行交流,会根据用户的输入提供情感支持和指导。应...
阅读原文

BnbIcons

BnbIcons是AI驱动的图标生成工具,能创建类似Airbnb风格的等轴测图标。用户只需输入文字描述或上传参考图片,AI能生成符合要求的图标。提供464+个预制图标,...
阅读原文

3DTown

3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域,...
阅读原文

CoreAgent

CoreAgent是网易智企推出的企业级智能体开发协作平台。支持问答、工作流、自主智能体等多种形态的智能体开发、测评和托管。平台采用RAG技术构建知识库,具备...
阅读原文

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台。基于先进的AI技术和3D成像,将2D视频流转换为逼真的3D效果,让远程通话更自然、更直观。用户能像面对面一样...
阅读原文

CodeWave

CodeWave 是网易数帆推出的低代码开发平台,通过智能化手段提升软件开发效率。具备数据模型设计、页面搭建、逻辑与流程设计等核心功能,支持从简单应用到复杂...
阅读原文

Aurora

Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训...
阅读原文

DeepWiki MCP

DeepWiki MCP 是Cognition Labs推出的远程服务器,基于开放标准的 Model Context Protocol(MCP)。DeepWiki MCP为 AI 应用提供访问和搜索 GitHub 代码库文档...
阅读原文