什么是元学习(Meta-Learning)

元学习(Meta-Learning),也称为“学会学习”,是机器学习领域中一个令人兴奋且极具潜力的研究方向。它的核心目标是让机器学习系统学会高效地学习新任务,解决...
阅读原文

什么是视频扩散模型(Video Diffusion Models, VDM)

视频扩散模型(Video Diffusion Models, VDM)是一种结合了变分自编码器(VAE)和扩散模型优势的生成模型。VDM的核心思想是在潜在空间中进行扩散过程,而不是...
阅读原文

什么是遗传算法(Genetic Algorithm, GA)

遗传算法(Genetic Algorithm, GA)是一种模拟生物进化过程的启发式搜索算法,属于进化算法的范畴。它们基于自然选择和遗传学的思想,通过模拟自然选择过程中...
阅读原文

什么是大模型幻觉(Hallucinations of large models)

大模型幻觉(Hallucinations of large models)指的是模型生成的内容与现实世界事实或用户输入不一致的现象。
阅读原文

LangGraph

LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大型语言模型(LLMs)一起使用时,用在创建代理和多代理工作流。作为 LangChain ...
阅读原文

R2R

R2R是先进的AI检索系统,专注于Retrieval-Augmented Generation(增强型检索生成)。R2R集成多模态内容摄取、混合搜索、知识图谱构建、GraphRAG聚类分析、用...
阅读原文

PanoDreamer

PanoDreamer是能够从单张图像生成连贯的360° 3D场景的新方法。这种方法不同于现有技术,它将问题构建为单图像全景和深度估计的两个优化任务,并引入交替最小...
阅读原文

百度AI搜

百度AI搜是百度基于文心大模型打造的桌面端AI搜索引擎。整合了百度搜索引擎、百度健康、百度律临、百度文库、百度教育等多个内容生态,确保搜索结果的可靠性...
阅读原文

TANGOFLUX

TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7秒生成长达30秒的...
阅读原文

MMedAgent

MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(MLLM),作为行动...
阅读原文

VITRON

VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和视频进行理解、...
阅读原文

TECHSPECS

TECHSPECS(TechSpecs Ray)是创新的AI驱动媒体播放器,通过实时AI字幕技术革新您的视听体验。支持99种语言的字幕生成,打破了语言障碍,让全球用户都能享受...
阅读原文