AI工具

Inf-DiT

Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从...
阅读原文

SocraticLM

SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学...
阅读原文

VMix

VMix是创新的即插即用美学适配器,旨在提升文本到图像扩散模型生成图像的美学质量。通过解耦输入文本提示中的内容描述和美学描述,将细粒度的美学标签(如色...
阅读原文

smoltalk-chinese

smoltalk-chinese 是OpenCSG开源的专为中文大型语言模型(LLM)设计的合成数据集,该数据集包含超过 70 万条合成数据,涵盖了信息查询、推理、计划、编辑、编...
阅读原文

RLCM

RLCM(Reinforcement Learning for Consistency Model)是康奈尔大学推出用在优化文本到图像生成模型的框架,基于强化学习方法微调一致性模型适应特定任务的...
阅读原文

LLM2LLM

LLM2LLM是创新的迭代数据增强策略,旨在提升大型语言模型(LLM)在数据稀缺情况下的性能。方法通过基于一个强大的教师模型来生成合成数据,增强学生模型的训...
阅读原文

CodeElo

CodeElo 是用于评估大型语言模型(LLMs)在编程竞赛级别代码生成能力的基准测试工具。通过与人类程序员的 Elo 评级系统进行比较,来衡量 LLMs 的编程水平。工...
阅读原文

FlexRAG

FlexRAG 是创新的检索增强生成(RAG)框架,旨在解决传统 RAG 系统在处理长上下文时面临的计算成本高和生成质量不足的问题。通过将检索到的上下文信息压缩成...
阅读原文

GeneralDyG

GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,旨在解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时间 ego-graph...
阅读原文

海豚AI配音

海豚AI配音是功能全面的AI配音工具,能将文本转换为逼真、富有情感的语音。海豚AI配音提供超500种真人音色和1000多种二次元音色,支持20多种语言,满足不同用...
阅读原文

J1 Assistant AI

J1 Assistant AI 是罗永浩旗下的 AI 初创项目 Jarvis 推出的聚合类 AI 助理软件。软件目前仅提供安卓版本,并且官网对国内 IP 进行了锁定。J1 Assistant AI ...
阅读原文

Weights

Weights 是AI创作平台,基于AI技术创作各种类型的多媒体内容。用户在平台上免费创建多种作品,包括语音翻唱、合唱、文字转语音、图片、视频、音乐,及与 AI ...
阅读原文

LangGraph

LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大型语言模型(LLMs)一起使用时,用在创建代理和多代理工作流。作为 LangChain ...
阅读原文

R2R

R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分析、用...
阅读原文

PanoDreamer

PanoDreamer是能够从单张图像生成连贯的360° 3D场景的新方法。这种方法不同于现有技术,它将问题构建为单图像全景和深度估计的两个优化任务,并引入交替最小...
阅读原文