标签:情感分析

MetaMorph:智能多模态产品提升用户体验与交互效率

MetaMorph是多模态大模型(MLLM),通过指令微调(Instruction Tuning)实现视觉理解和生成。它提出了一种名为Visual-Predictive Instruction Tuning(VPiT)...
阅读原文

Liner:智能推荐与信息管理的全能助手

Liner是专为学生和研究人员打造的AI搜索引擎,致力于提升研究效率。Liner提供可信来源、自动引用生成、事实核查和筛选功能,帮助用户快速、准确地获取信息。L...
阅读原文

Emoji AI

Emoji AI是AI驱动的表情包制作应用,主打卡通风格,提供搜索和文生图功能,让用户能快速创建个性化表情。Emoji AI特别推出节日主题表情,适应不同文化和节日...
阅读原文

点点:AI搜索助手让生活场景变得更简单聪明

点点是主打生活场景的聚合搜索AI应用,上海生动诗章科技有限公司开发。具有生活搜索助手功能,能贴心地帮助用户找到并总结出日常生活中遇到的问题的答案。具...
阅读原文

Emoji AI:个性化AI表情包生成器,让你的情感随时随地生动表达

Emoji AI是AI驱动的表情包制作应用,主打卡通风格,提供搜索和文生图功能,让用户能快速创建个性化表情。Emoji AI特别推出节日主题表情,适应不同文化和节日...
阅读原文

Easy-Peasy.AI:全方位AI创作平台,轻松实现图像、音频和文本的智能生成与转录

Easy-Peasy.AI 是一站式平台,提供内容创作、图像生成、音频转录和文本转语音等多种服务。Easy-Peasy.AI基于强大的AI技术,帮助用户快速生成高质量内容,提升...
阅读原文

Klap:智能视频编辑工具,实现精彩片段自动识别与智能布局优化

Klap是AI驱动的视频编辑工具,专注于将长视频快速转换为适合社交媒体平台的短视频内容。Klap智能分析视频场景,自动裁剪和调整视频布局,生成适合不同平台的...

EMMA-X:具身多模态动作模型推动人机交互的革新与应用

EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenVLA创建。EMMA-X结合层次化的具身数据集...

SPIKY.AI:智能销售助手实时分析通话数据助力策略优化

SPIKY.AI是专为销售团队设计的实时AI助理,基于分析销售通话、客户互动和培训会议等,提供实时洞察,引导销售代表按照销售手册执行,自动更新CRM,提升销售绩...

Lyra:提升多模态交互体验的SmartMore创新解决方案

Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
阅读原文

Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署

Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)...
阅读原文

Apollo:Meta与斯坦福大学携手推出创新多模态模型,实现图像与文本的深度融合与理解

Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解在LMMs中的关键驱动因素,推出“Scaling Cons...
阅读原文

Veo 2:高分辨率4K视频生成的先进AI模型,助力创意无限

Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控制指令,能模...
阅读原文

星流AI:全新一站式AI图像生成平台助力创意无限探索

星流AI是LiblibAI推出的一站式AI图像生成平台,基于自研的Star-3通用图像生成模型,结合全球最大的LoRA增强模型库和先进的AI图像控制技术。为设计师、摄影师...
阅读原文

FLOAT:音频驱动的流匹配技术实现动态说话人头像生成

FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基...
阅读原文
13456724