AI项目和框架

MiniPerplx

MiniPerplx 是开源的 AI 搜索引擎,基于 Grok 2.0 模型进行搜索。MiniPerplx提供了免费的替代方案,用在搜索网页、推特帖子、研究论文和 YouTube 视频等内容...
阅读原文

AddressCLIP

AddressCLIP 是基于 CLIP 技术构建的端到端图像地理定位模型,由中科院自动化所和阿里云联合开发。模型能通过一张照片实现街道级精度的定位,直接预测图像拍...
阅读原文

TradingAgents

TradingAgents是加利福尼亚大学洛杉矶分校和麻省理工学院推出的多代理LLM金融交易框架,能模拟现实世界的交易公司环境。TradingAgents整合多个具有不同角色和...
阅读原文

CreatiLayout

CreatiLayout 是复旦大学和字节跳动联合提出的创新的布局到图像生成(Layout-to-Image, L2I)技术。通过构建大规模的布局数据集 LayoutSAM,包含 270 万图像-...
阅读原文

RealisHuman

RealisHuman 是创新的后处理框架,旨在细化生成图像中的人体部位,如手和脸等。框架通过两阶段的方法来实现这一目标。首先,使用原始的畸形部位作为参考,生...
阅读原文

Cosmos

Cosmos是英伟达推出的生成式世界基础模型平台,旨在加速物理人工智能(AI)系统的发展,特别是在自动驾驶和机器人领域。Cosmos能接受文本、图像或视频的提示...
阅读原文

优云智算

优云智算是UCloud优刻得旗下的GPU算力租赁平台,专注于为AI应用提供高效、灵活的算力资源。支持按需租赁,满足不同项目需求。平台拥有丰富的镜像社区,提供多...
阅读原文

KAG

KAG(Knowledge Augmented Generation)是蚂蚁集团推出的专业领域知识服务框架,基于知识增强提升大型语言模型(LLMs)在特定领域的问答性能,为垂直领域的知...
阅读原文

Gemini Coder

Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 应用。Gemini Coder基于简单的描述,结合 Sandpack 实现实时...
阅读原文

AIOpsLab

AIOpsLab是微软公司、加州大学伯克利分校、伊利诺伊大学香槟分校、微软研究院等机构推出的,用在构建、评估和改进云服务运营管理AIOps代理的原型框架。AIOpsL...
阅读原文

VideoRefer

VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言模型(Video LLMs)的空间-时间理解能力,让模型能在...
阅读原文

JoyCaption

JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向,最小化过滤理解世界的各个方面,但不...
阅读原文

麦橘超然

麦橘超然(MajicFlus)是由麦橘推出的基于Flux.1架构的AI模型,专注于生成高质量的人像图像,擅长表现亚洲女性的细腻与美感。模型融合多种技术,能生成逼真的...
阅读原文

CHRONOS

CHRONOS是上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的,用在新闻时间线摘要生成的新型框架,基于迭代自问自答的方式,用大型语...
阅读原文

Edicho

Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑。Edicho用免训练的方法,无需...
阅读原文
1111213141583