AI项目和框架

Napkins.dev

Napkins.dev是一个创新的开源项目,基于AI技术将用户的截图或线框图快速转换成可运行的网页应用程序。该、项目背后依托于Meta的Llama 3.1 405B大型语言模型和...
阅读原文

MDM

Matryoshka Diffusion Models(MDM)是由苹果公司研究人员推出的一种新型扩散模型框架,旨在解决生成高分辨率图像和视频时面临的计算和优化挑战。MDM基于在多...
阅读原文

mPLUG-DocOwl 1.5

mPLUG-DocOwl 1.5是由阿里巴巴集团推出的多模态大型语言模型,专注于OCR-free(无需光学字符识别)的文档理解。模型基于统一结构学习,强化对文本丰富图像如...
阅读原文

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视觉质量和评估性能上取得突破性进展。模型在扩...
阅读原文

SaRA

SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基...
阅读原文

Quanta Quest

Quanta Quest是一款面向个人用户的开源AI时代智能数据库产品,基于将个人数据如Gmail、Dropbox、Notion等整合到一个平台上,用RAG技术提供AI搜索功能,帮助用...
阅读原文

BiGR

BiGR是一种新型的条件图像生成模型,用紧凑的二进制潜在代码进行生成训练,增强图像的生成质量和表示能力。作为首个在同一框架内统一生成和判别任务的模型,B...
阅读原文

MoE++

MoE++是一种新型的混合专家(Mixture-of-Experts)架构,由昆仑万维2050研究院与北大袁粒团队联合推出。基于引入零计算量专家,即零专家、复制专家和常数专家...
阅读原文

Granite 3.0

Granite 3.0 是 IBM 推出的一系列先进的AI模型,能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用,能执行各种任务,包括文本生成、分...
阅读原文

Project Turntable

Project Turntable是Adobe在2024年MAX大会上推出的一款创新AI工具。工具能让用户像操作3D对象一样旋转2D矢量图像,即时生成图像所需的隐藏部分。用AI模型填充...
阅读原文

OmniAI

OmniAI是一个强大的AI文档处理平台,基于先进的OCR技术,支持对PDF、DOCX、图片等多种文件格式进行快速处理和数据提取。平台支持用户轻松创建文档处理管道,...
阅读原文

TaskWeaver

TaskWeaver是由微软推出的一个代码优先的AI智能体框架,专注于无缝规划和执行数据分析任务。基于代码片段解释用户请求,高效协调各种插件(以函数形式)执行...
阅读原文

Stable Diffusion 3.5

Stable Diffusion 3.5是Stability AI公司最新推出的一系列先进的AI图像生成模型,包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo和即将...
阅读原文

Mochi 1

Mochi 1是Genmo公司推出的开源视频生成模型,在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apache 2.0许可证发布,支持个人和商业用途的免费使用。模型...
阅读原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持与前代 Claude 3 Haiku 相近的速度和成本的同时,实现了在各项能力上的提升,在多项基...
阅读原文
1747576777884