AI项目和框架

iAgents:多智能体协作创新框架推动人工智能高效协同与任务优化

iAgents是清华大学推出的多AI智能体协作框架,基于为每个用户配备个人AI智能体促进协作和完成日常任务。智能体能理解用户的文件、命令,从协作中学习,实现自...
阅读原文

DanceFusion:音频驱动的舞蹈动作重建与生成开源框架助力创意舞蹈表达

DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时空Transformer-VAE和扩散模型,能处理社交媒体上的不完整...
阅读原文

Symphony Creative Studio:TikTok推出智能AI广告创意视频生成工具,轻松打造个性化广告内容

Symphony Creative Studio是TikTok推出的AI视频创作工具,帮助广告主和内容创作者简化视频制作流程。Symphony Creative Studio集成视频生成、转换和扩展功能...
阅读原文

Skywork o1:天工大模型4.0 O1版:智能生成与多模态交互的革新体验

Skywork o1是昆仑万维推出的天工大模型4.0 o1版,是国内首款具备中文逻辑推理能力的o1模型。Skywork o1在模型输出中内生了思考、计划、反思等能力,显著提升...
阅读原文

Voyage Multimodal-3:多模态嵌入模型引领AI创新实现更智能的跨领域理解与应用

Voyage Multimodal-3 是 Voyage AI 推出的先进的多模态嵌入模型,能处理交错的文本和图像,并从 PDF、幻灯片、表格等截图中捕捉关键视觉特征,无需复杂文档解...
阅读原文

Hali:多模态智能体协作解决方案提升团队效率与创新能力

Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点,语义理解准确率超...
阅读原文

Agent K v1.0:全新端到端自主数据科学智能体助力智能决策与数据分析优化

Agent K v1.0 是华为诺亚方舟实验室与伦敦大学学院团队联合推出的端到端自主数据科学智能体,能自动化、优化和泛化处理多种数据科学任务。Agent K v1.0基于结...
阅读原文

Pixtral Large:Mistral AI推出的超大多模态模型实现先进的文本与视觉理解能力

Pixtral Large是法国Mistral AI开源的1240亿参数超大多模态模型,具备前沿级图像理解能力,支持128K上下文,能理解文本、图表和图像。Pixtral Large基于Mistr...
阅读原文

Qwen2.5-Turbo:超高上下文理解能力的长文本模型实现1M tokens支持,助力智能文本生成与分析

Qwen2.5-Turbo是阿里推出的先进语言模型,将上下文长度从 128k 扩展到了 1M ,相当于100万个英文单词或150万个汉字。扩展让模型能处理更长的文本,如长篇小说...
阅读原文

LLaVA-o1:开源视觉语言模型助力智能理解与生成内容

LLaVA-o1是北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队推出的开源视觉语言模型,基于Llama-3.2-Vision...
阅读原文

PixelWave Flux:FLUX.1-dev模型微调版赋能创意图像生成的全新可能

PixelWave Flux.1-dev 03是基于FLUX.1-dev模型在NVIDIA 4090上微调的AI图像生成模型,有卓越的模型泛化能力,模型在处理多种艺术风格、摄影和动漫图像方面表...
阅读原文

Computer Use OOTB:基于Claude 3.5 API的开源GUI框架实现高效远程控制解决方案

Computer Use OOTB是开源的GUI 框架,基于Claude 3.5 Computer Use API实现对计算机的自动化控制。框架支持跨平台操作,用户在Windows和macOS系统上能轻松部...
阅读原文

Fireworks f1:复合AI模型融合多元开源技术以应对复杂推理挑战

Fireworks f1是Fireworks公司推出的复合AI模型,针对复杂推理任务设计。基于在推理层融合多个开放模型,实现超越单一模型的性能和可靠性。f1模型支持开发者用...
阅读原文

AgileGen:智能代码自动生成与原型设计的创新解决方案

AgileGen是生成式软件开发框架,通过人与AI协作增强软件的创建过程。AgileGen包含两个核心部分:终端用户决策制定和AgileGen智能体。框架用Gherkin语言设计和...
阅读原文

OmniSearch:多模态智能检索与生成技术的全面升级

OmniSearch是阿里巴巴通义实验室推出的多模态检索增强生成框架,具备自适应规划能力。OmniSearch能动态拆解复杂问题,根据检索结果和问题情境调整检索策略,...
阅读原文
17071727374115