AI工具

DeepSeek Engineer

DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 ...
阅读原文

AIGIF

AIGIF是基于AI技术的个性化GIF表情包制作平台,让用户能将自己的面孔无缝融入到GIF、电影片段和流行文化瞬间中,创造出个性化的表情包。用户只需选择一个GIF...
阅读原文

jagoda.AI

jagoda.AI是基于AI技术提供在线辅导的平台,帮助学生解决家庭作业问题。平台支持30多个学校科目的辅导,并能将解答翻译成20多种语言。jagoda.AI强调个性化学...
阅读原文

PixVerse V3.5

PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本,在性能和功能上都有显著提升。能在最快5秒内生成视频,显著增强了运动控制力,提供了更加流畅和精...
阅读原文

VideoPhy

VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则。VideoPhy基准...
阅读原文

Large Motion Model

Large Motion Model(LMM)是统一的多模态运动生成模型,是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括文本到运动、音乐到舞蹈等多...
阅读原文

StereoCrafter

StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架,能将单目视频(2D视频)转换为立体3D视频,满足日益增长的3D内容需求。StereoCrafter基于深度估计、...
阅读原文

SPAR

SPAR是智谱团队推出的自我博弈框架,能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成者执行指令生成回复,完...
阅读原文

LowCodeEngine

LowCodeEngine是阿里巴巴开源的低代码开发框架,基于提供拖拽、配置等简单操作,让开发者快速构建复杂的系统页面。框架以强大的定制能力、优雅的开发体验、丰...
阅读原文

Qwen-Agent

Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agent支持函...
阅读原文

Mind GPT-3o

Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力,能提...
阅读原文

琅琊

琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本,专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科学知识,能实...
阅读原文

DynamicControl

DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicControl通过自...
阅读原文

VE-Bench

VE-Bench 是北京大学的研究团队 MMCAL 最近发布首个专门针对视频编辑质量评估的指标。VE-Bench 的设计目标是与人类感知能力高度一致,更准确地评估视频编辑效...
阅读原文

EDTalk

EDTalk是上海交通大学联合网易研发的音频驱动唇部同步模型,能实现对嘴型、头部姿态和情感表情的独立操控。只需上传一张图片、一段音频和参考视频,就能驱动...
阅读原文
19596979899234