CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,能提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在不同任...
阅读原文

WonderPlay

WonderPlay 是斯坦福大学联合犹他大学推出的新型框架,支持从单张图片和用户定义的动作生成动态3D场景。基于结合物理模拟和视频生成技术,用物理求解器模拟粗...
阅读原文

SOM AI

SOM AI 是 AI 辅助学术写作工具,帮助学生轻松完成毕业论文(Skripsi)和学术研究。工具基于自然语言交互,提供研究主题头脑风暴、段落释义、简化复杂内容等...
阅读原文

PxBee

PxBee 是在线AI图片编辑平台,基于先进的人工智能技术,帮助用户快速移除图片背景、增强图片质量以及生成新的背景。用户只需上传图片,PxBee 的 AI 工具能自...
阅读原文

Unmute

Unmute 是 Kyutai 推出的低延迟语音交互系统,专注于低延迟语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。Unmute 基于先进的 AI 模型,为用...
阅读原文

OpusClip Thumbnail

OpusClip Thumbnail 是 OpusClip 团队推出的免费的 AI 缩略图生成工具,专为 YouTube 创作者设计,用于快速生成视频缩略图。用户只需粘贴视频链接,AI 会自动...
阅读原文

YouWare

YouWare 是明超平(Leon Ming)创立的AI编程社区平台。帮助用户通过AI Coding将创意转化为作品,降低编程门槛。用户只需用自然语言描述需求,AI能生成代码,...
阅读原文

LMEval

LMEval 是谷歌推出的开源框架,用在简化大型模型(LLMs)的跨提供商评估。框架支持多模态(文本、图像、代码)和多指标评估,兼容 Google、OpenAI、Anthropic...
阅读原文

LLaDA-V

LLaDA-V是中国人民大学高瓴人工智能学院、蚂蚁集团推出的多模态大语言模型(MLLM),基于纯扩散模型架构,专注于视觉指令微调。模型在LLaDA的基础上,引入视...
阅读原文

剪小映

剪小映是抖音推出的AI视频剪辑应用,专为零基础用户设计,操作简单便捷。具备AI智能解析功能,可精准识别素材中的场景、人物等元素,为用户提供智能剪辑指引...
阅读原文

Company Research Agent

Company Research Agent是基于多智能体框架的公司研究工具,支持一键自动生成全面的公司研究报告。工具从公司网站、新闻文章、财务报告和行业分析等多源数据...
阅读原文

Direct3D-S2

Direct3D-S2 是南京大学、DreamTech、复旦大学和牛津大学的研究人员共同推出的高分辨率 3D 生成框架,基于稀疏体积表示和创新的空间稀疏注意力(SSA)机制,...
阅读原文

Uplyt

Uplyt 是基于AI技术的分析工具,支持简化 Google Analytics 的数据管理和分析流程。工具基于清晰的仪表盘展示关键指标,如自然搜索流量和转化趋势,让用户轻...
阅读原文

QwenLong-L1

QwenLong-L1-32B 是阿里巴巴集团 Qwen-Doc 团队推出的,基于强化学习训练的首个长文本推理大模型。模型基于渐进式上下文扩展、课程引导的强化学习和难度感知...
阅读原文

AgenticSeek

AgenticSeek是完全本地化的开源AI助手,也是 Manus 的开源平替。AgenticSeek能在本地设备上自主执行任务,如浏览网页、编写代码、规划复杂项目等,所有数据和...
阅读原文