标签:个性化推荐
LongLLaVA:多模态上下文混合架构大语言模型的创新应用与特点解析
LongLLaVA是多模态大型语言模型(MLLM),基于混合架构结合Mamba和Transformer模块,能高效处理大量图像,特别擅长视频理解和高分辨率图像分析。LongLLaVA在...
Devika AI:智能AI助手助力高效执行复杂任务
Devika AI是印度Stition AI团队推出的开源AI软件开发工具,能理解并执行复杂的人类指令,将其分解为步骤,进行研究和信息搜集,最终编写代码以实现目标。Devi...
红薯智语:自然清新,焕发肌肤光彩的护肤秘笈
红薯智语是为小红书创作者设计的智能文案生成工具。通过分析上传的图片和关键词,快速生成适配不同风格和场景的文案。用户可以自定义文案长度,选择多种文案...
Kimi 创作空间:一键生成个性化音乐视频的AI创作工具
Kimi创作空间是Kimi最新推出的AI视频生成工具,用户可以非常简单地创作个性化音乐视频。Kimi创作空间支持12种预设风格模板,也支持用户通过自定义创作来制作...
SAM 2.1:Meta开源的先进视觉分割模型提升图像处理精度与效率
SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transformer架构和流式记忆设计...
金舟AI助手:创新设计与卓越性能的完美结合提升您的生活品质
金舟AI助手是创新的营销内容创作平台,基于人工智能和大数据技术,为创作者、品牌主和营销服务公司提供高效的内容创作解决方案。平台能快速生成富有创意和针...
Mooncake:创新推理架构推动大模型智能应用的新时代
Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充...
QwQ-32B-Preview:超越O1模型的阿里开源AI推理产品实现高效精准的智能决策
QwQ-32B-Preview(QwQ-32B)是阿里巴巴开源的实验性研究AI模型,以强大的推理能力著称,尤其在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处...
悦灵犀AI:创新的Stable Diffusion多模态模型赋能AI绘画创作平台
悦灵犀是基于Stable Diffusion多模态模型的AI绘画和创作平台。基于先进的人工智能技术,为用户提供动漫风格、Mindjourney风格、ControlNet图片优化设计等多种...
AI酱:实时多语言对话的二次元风格AI助手
AI酱是二次元风格的AI多语言智能聊天APP,提供了多个二次元萌妹和帅哥形象,用户可以与这些角色进行面对面的即时对话。应用基于语音识别能力和人工智能技术,...
Illustrious:高质量动漫风格图像生成的创新开源模型
Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高...
SlideChat:智能视觉语言助手助力多模态交互体验
SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的,首个能理解千兆像素级别全切片图像的视觉语言助手。SlideChat能生成详尽的全切片图像描述,...
MCP:Anthropic开源模型上下文协议的核心优势与创新特点
MCP(Model Context Protocol,模型上下文协议)是一个开放协议,是Anthropic开源的,能实现大型语言模型(LLM)应用与外部数据源和工具之间的无缝集成。基于...
LEOPARD:腾讯AI Lab推出的视觉语言模型赋能多模态理解与生成
LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD基于两个主要技术创新:一是策划约一百万条专门...
Pangea:多语言多模态大语言模型的创新特性与应用前景
Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言模型(LLM),能提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集,支持39种语言...