标签:情感分析
EMMA-X:具身多模态动作模型推动人机交互的革新与应用
EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenVLA创建。EMMA-X结合层次化的具身数据集...
SPIKY.AI:智能销售助手实时分析通话数据助力策略优化
SPIKY.AI是专为销售团队设计的实时AI助理,基于分析销售通话、客户互动和培训会议等,提供实时洞察,引导销售代表按照销售手册执行,自动更新CRM,提升销售绩...
Lyra:提升多模态交互体验的SmartMore创新解决方案
Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署
Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)...
Apollo:Meta与斯坦福大学携手推出创新多模态模型,实现图像与文本的深度融合与理解
Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解在LMMs中的关键驱动因素,推出“Scaling Cons...
Veo 2:高分辨率4K视频生成的先进AI模型,助力创意无限
Veo 2 是 Google DeepMind 推出的 AI 视频生成模型,能根据文本或图像提示生成高质量视频内容。Veo 2支持高达 4K 分辨率的视频制作,理解镜头控制指令,能模...
星流AI:全新一站式AI图像生成平台助力创意无限探索
星流AI是LiblibAI推出的一站式AI图像生成平台,基于自研的Star-3通用图像生成模型,结合全球最大的LoRA增强模型库和先进的AI图像控制技术。为设计师、摄影师...
FLOAT:音频驱动的流匹配技术实现动态说话人头像生成
FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间实现高效的时间一致性运动设计。模型基...
塔猫AI对话PPT:智能PPT助手提升演示效率与内容互动体验
塔猫AI对话PPT是塔猫AI推出的新一代智能PPT分析工具,基于深度学习算法和自然语言处理技术,实现对PPT内容的语义理解和上下文分析,为用户带来全新的办公体验...
PaliGemma 2:DeepMind推出性视觉语言模型,实现跨媒体理解与生成
PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...
Star-3 Alpha:LiblibAI联合星流推出的创新图像生成大模型以卓越细节和智能创意重塑视觉体验
Star-3 Alpha是LiblibAI推出的图像基座大模型,基于F.1基础算法架构。模型提升了在图像精准度、色彩表现力、美学捕捉等方面。Star-3 Alpha能精准响应复杂提示...
Perplexideez:智能信息追溯助手提升搜索效率与准确性
Perplexideez是本地AI助手,支持用户在网络和自托管应用中快速搜索信息。Perplexideez项目以Postgres数据库为基础,支持Ollama或OpenAI兼容的端点,用SearXNG...
Pi:多种生成方式的智能创作平台助力高效内容创作
Pi(Presentation Intelligence)是AI-Native的互动内容创作和共享平台,基于AI简化演示文档的创作过程。Pi支持多种内容生成方式,包括一句话生成、文件导入...
百度“文小言”:探索AI社交新境界
原标题:百度“文小言”:探索AI社交新境界 文章来源:小夏聊AIGC 内容字数:1476字人工智能社交应用的崭新体验 随着人工智能技术的迅猛发展,AI社交应用逐渐...
potis.ai:智能面试助手提升面试效率与精准度的创新解决方案
potis.ai 是基于AI技术的招聘平台,专为远程团队吸引和筛选顶尖人才而设计。基于自动化行为面试、智能面试协助和人才评分系统来提高招聘效率,节省时间和成本...