标签:多语言支持

EMMA-X:具身多模态动作模型推动人机交互的革新与应用

EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenVLA创建。EMMA-X结合层次化的具身数据集...

SPIKY.AI:智能销售助手实时分析通话数据助力策略优化

SPIKY.AI是专为销售团队设计的实时AI助理,基于分析销售通话、客户互动和培训会议等,提供实时洞察,引导销售代表按照销售手册执行,自动更新CRM,提升销售绩...

Lyra:提升多模态交互体验的SmartMore创新解决方案

Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
阅读原文

Particle News:个性化视角下的AI新闻阅读平台,全面满足您的信息需求

Particle News是AI驱动的新闻阅读平台,基于汇总用户关心的话题,提供简洁的新闻摘要和多角度报道,帮助用户快速理解重要信息。用户能关注特定人物、地点或事...
阅读原文

星流AI:全新一站式AI图像生成平台助力创意无限探索

星流AI是LiblibAI推出的一站式AI图像生成平台,基于自研的Star-3通用图像生成模型,结合全球最大的LoRA增强模型库和先进的AI图像控制技术。为设计师、摄影师...
阅读原文

书生·万象InternVL 2.5:创新驱动的多模态大语言模型提升智能交互体验

书生·万象InternVL 2.5是上海AI实验室的OpenGVLab团队推出的开源多模态大型语言模型(MLLM)系列。该系列模型在InternVL 2.0的基础上进行显著增强,特别是在...
阅读原文

塔猫AI对话PPT:智能PPT助手提升演示效率与内容互动体验

塔猫AI对话PPT是塔猫AI推出的新一代智能PPT分析工具,基于深度学习算法和自然语言处理技术,实现对PPT内容的语义理解和上下文分析,为用户带来全新的办公体验...
阅读原文

presti:智能室内家具AI图像生成工具提升设计创意与效率

presti是法国初创公司,基于生成式AI技术为家具行业提供产品摄影解决方案。presti能将单一产品图像转化为逼真的生活场景照片,显著降低成本并提高效率。公司...
阅读原文

文小言电脑版:文心一言PC版免费下载,兼容Windows和Mac,助力高效创作与智能交互

文小言电脑版是功能强大的桌面级智能助手,通过自然语言处理技术,为用户提供智能化的信息服务和交互体验。具备文档解析、搜创一体、一键导出等功能,使信息...
阅读原文

One Shot, One Talk:中科大与香港理工携手打造创新动态图像生成技术,实现实时创作与智能化设计

One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说话头像,支持逼真的动画效果,包括自然的表情变化和生动的身体动作...
阅读原文

海螺AI Audio:智能语音合成助手打造自然流畅对话体验

海螺AI Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。用户只需提供30秒的音频素材,可以克隆特定人的声音,支持12种语言...
阅读原文

PaliGemma 2:DeepMind推出性视觉语言模型,实现跨媒体理解与生成

PaliGemma 2是Google DeepMind基于Gemma 2语言模型家族推出的新一代视觉语言模型(VLM),作为PaliGemma模型的升级版。结合SigLIP-So400m视觉编码器和不同规...
阅读原文

ClearerVoice-Studio:智能语音处理框架助力多场景应用的高效解决方案

ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除...
阅读原文

InsCode AI IDE:CSDN与华为云携手推出智能编程助手,助力开发者高效编码与问题解决

InsCode AI IDE是CSDN、GitCode和华为云CodeArts IDE联合推出的AI增强型跨平台集成开发环境。InsCode AI IDE集成AI编程能力,帮助开发者更高效地编写、调试和...
阅读原文

Micro LLAMA:探索LLAMA 3模型的核心原理与应用特点

Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLAMA 3中最小的...
阅读原文
1242526272858