Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Robotics-ER 和...
阅读原文

PP-TableMagic

PP-TableMagic 是百度飞桨团队推出的高性能表格识别工具,用在将图片中的表格结构化信息提取出来,转换为 HTML 等格式,进行进一步的数据处理和分析。PP-Tabl...
阅读原文

子曰翻译2.0

子曰翻译2.0是网易有道推出的最新翻译大模型,模型在数据、算法和评估三个关键维度进行了系统性升级,实现了翻译质量、效率和鲁棒性的质的飞跃。 在数据层面...
阅读原文

理想同学网页版

理想同学网页版是理想汽车推出的网页端AI智能助手,为用户提供智能交互服务。网页版接入了DeepSeek R1&V3 671B满血版模型,问答支持切换选择 MindGPT-3o ...
阅读原文

Motion Anything

Motion Anything 是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或两者的组合生成高质量、可控的人...
阅读原文

谜境

谜境是国内首款AI创作Agent的互动剧本平台,专注于互动小说和剧本创作。平台搭载DeepSeek R1的推理思考能力,实现从剧本大纲、人物设定、角色关系图、分镜脚...
阅读原文

飞算JavaAI

飞算JavaAI是飞算科技推出的智能Java开发助手。通过自然语言输入,实现从需求分析到代码生成的全流程智能化开发。核心功能包括需求分析、软件设计、代码生成...
阅读原文

Reka Flash 3

Reka Flash 3 是 Reka AI 推出的开源推理模型,拥有 21 亿参数。支持多模态输入,包括文本、图像、视频和音频,可处理最多 32k 个令牌的上下文长度,适用于一...
阅读原文

Ganttable

Ganttable 是基于甘特图的智能项目管理工具,结合 AI 技术和强大的在线编辑功能。用户只需输入项目主题,能快生成详细的项目计划,基于 AI 实现任务分解和进...
阅读原文

MM-StoryAgent

MM-StoryAgent 是上海交通大学X-LANCE实验室和阿里巴巴集团联合推出的开源、多模态、多智能体框架,用在生成沉浸式的有声故事绘本视频。基于结合大型语言模型...
阅读原文

Docwelo

Docwelo 是专为自由职业者和小型企业设计的 AI 驱动文档生成平台。用户只需选择文档类型并回答几个简单问题,AI 能快速生成格式完美、语言专业的文档,涵盖法...
阅读原文

Deep Research Web UI

Deep Research Web UI 是开源的 AI 研究助手工具,帮助用户高效地进行深度研究。通过 AI 驱动的迭代搜索,逐步深入挖掘指定主题,以树状结构可视化研究过程,...
阅读原文

Gemma 3

Gemma 3 是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过 35 种语言,具备分析文本、图像及短视频的能力,...
阅读原文

PP-DocBee

PP-DocBee是百度飞桨(PaddlePaddle)团队推出的专注于文档图像理解的多模态大模型。基于ViT+MLP+LLM架构,具备强大的中文文档解析能力,能高效处理文字、表...
阅读原文

BEHAVIOR Robot Suite

BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成日常家务任务的框架。基于分析家务活动,确定机器人需要具备的关键能力,包括...
阅读原文