RLCM

RLCM(Reinforcement Learning for Consistency Model)是康奈尔大学推出用在优化文本到图像生成模型的框架,基于强化学习方法微调一致性模型适应特定任务的...
阅读原文

LLM2LLM

LLM2LLM是创新的迭代数据增强策略,旨在提升大型语言模型(LLM)在数据稀缺情况下的性能。方法通过基于一个强大的教师模型来生成合成数据,增强学生模型的训...
阅读原文

CodeElo

CodeElo 是用于评估大型语言模型(LLMs)在编程竞赛级别代码生成能力的基准测试工具。通过与人类程序员的 Elo 评级系统进行比较,来衡量 LLMs 的编程水平。工...
阅读原文

FlexRAG

FlexRAG 是创新的检索增强生成(RAG)框架,旨在解决传统 RAG 系统在处理长上下文时面临的计算成本高和生成质量不足的问题。通过将检索到的上下文信息压缩成...
阅读原文

GeneralDyG

GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,旨在解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时间 ego-graph...
阅读原文

海豚AI配音

海豚AI配音是功能全面的AI配音工具,能将文本转换为逼真、富有情感的语音。海豚AI配音提供超500种真人音色和1000多种二次元音色,支持20多种语言,满足不同用...
阅读原文

J1 Assistant AI

J1 Assistant AI 是罗永浩旗下的 AI 初创项目 Jarvis 推出的聚合类 AI 助理软件。软件目前仅提供安卓版本,并且官网对国内 IP 进行了锁定。J1 Assistant AI ...
阅读原文

Weights

Weights 是AI创作平台,基于AI技术创作各种类型的多媒体内容。用户在平台上免费创建多种作品,包括语音翻唱、合唱、文字转语音、图片、视频、音乐,及与 AI ...
阅读原文

LangGraph

LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大型语言模型(LLMs)一起使用时,用在创建代理和多代理工作流。作为 LangChain ...
阅读原文

R2R

R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分析、用...
阅读原文

PanoDreamer

PanoDreamer是能够从单张图像生成连贯的360° 3D场景的新方法。这种方法不同于现有技术,它将问题构建为单图像全景和深度估计的两个优化任务,并引入交替最小...
阅读原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的可靠性...
阅读原文

TANGOFLUX

TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7秒生成长达30秒的...
阅读原文

MMedAgent

MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(MLLM),作为行动...
阅读原文

VITRON

VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和视频进行理解、...
阅读原文