标签:情感分析
EMOVA:华为诺亚方舟多模态处理模型全面提升智能交互与应用效率
EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、...
Devika AI:智能AI助手助力高效执行复杂任务
Devika AI是印度Stition AI团队推出的开源AI软件开发工具,能理解并执行复杂的人类指令,将其分解为步骤,进行研究和信息搜集,最终编写代码以实现目标。Devi...
红薯智语:自然清新,焕发肌肤光彩的护肤秘笈
红薯智语是为小红书创作者设计的智能文案生成工具。通过分析上传的图片和关键词,快速生成适配不同风格和场景的文案。用户可以自定义文案长度,选择多种文案...
吱意:智能多模态翻译与创作平台助力全球沟通与创意表达
吱意是AI多模态翻译平台,提供视频翻译、智能配音和音频转写等功能。平台基于智能语音识别技术和神经网络翻译技术,为用户提供专业高效的视频在线翻译服务。...
NVLM:英伟达推出的多模态大型语言模型赋能跨领域智能交互与应用
NVLM是NVIDIA推出的前沿多模态大型语言模型(LLMs),在视觉-语言任务上达到与顶尖专有模型(如GPT-4o)和开放访问模型(如Llama 3-V 405B和InternVL 2)相匹...
Qwen2vl-Flux:多模态图像生成模型赋能创意无限,支持多样化生成模式
Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、...
Mooncake:创新推理架构推动大模型智能应用的新时代
Mooncake是月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。采用以KVCache为中心的分布式架构,通过分离预填充和解码集群,充分利用GPU集群中未充...
QwQ-32B-Preview:超越O1模型的阿里开源AI推理产品实现高效精准的智能决策
QwQ-32B-Preview(QwQ-32B)是阿里巴巴开源的实验性研究AI模型,以强大的推理能力著称,尤其在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处...
悦灵犀AI:创新的Stable Diffusion多模态模型赋能AI绘画创作平台
悦灵犀是基于Stable Diffusion多模态模型的AI绘画和创作平台。基于先进的人工智能技术,为用户提供动漫风格、Mindjourney风格、ControlNet图片优化设计等多种...
ACE:全能图像生成与编辑模型赋能创意无限可能
ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格...
CLAID.AI:数字营销的全能图像处理工具提升品牌视觉效果
CLAID.AI 是基于人工智能的图像生成和优化平台,专为电子商务和数字营销领域设计。基于先进的AI技术,根据文本描述或现有图像快速生成逼真的产品照片。Claid....
DynaSaur:Adobe创新推出的多功能大语言模型代理框架提升创作效率与智能化体验
DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成...
Takin AudioLLM:创新零样本语音生成模型助力个性化语音合成体验
Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专...
AI酱:实时多语言对话的二次元风格AI助手
AI酱是二次元风格的AI多语言智能聊天APP,提供了多个二次元萌妹和帅哥形象,用户可以与这些角色进行面对面的即时对话。应用基于语音识别能力和人工智能技术,...
Illustrious:高质量动漫风格图像生成的创新开源模型
Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高...