标签:多语言支持

Diffree

Diffree是由OpenGVLab推出的AI贴图框架,能根据用户的文字描述,在图片中自动找到合适的位置添加新对象。通过智能掩码预测,无需手动绘制,即可确定新对象的...
阅读原文

JoyCoder

JoyCoder是京东推出的AI编程助手,专为提升研发效率设计。通过代码预测续写、智能问答等功能,帮助开发者快速编写代码,解决技术难题。支持多模型切换,适配J...
阅读原文

FLUX.1

FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型。包含三种变体:顶级性能的FLUX.1 [pro]、开源非商...
阅读原文

Tora

Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界动态的视频内容。Tora由轨迹...
阅读原文

Whisper-Medusa

Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与aiOla的创新,Whisper-Medusa引入了多头注意力机制,实现了并行处理,显著提升...
阅读原文

SAM 2

SAM 2(Segment Anything Model 2)是Meta推出的AI对象分割模型,专注于实时图像和视频对象分割。具备零样本泛化能力,能准确分割未知对象,并通过统一架构同...
阅读原文

星伴kChat

星伴kChat是KMind推出的AI聊天机器人,基于kOS操作系统运行。星伴kChat具备两种模式:工作模式,帮助用户高效完成任务,提供专业支持;闲聊模式,像朋友一样...
阅读原文

MaxKB

MaxKB是飞致云推出的开源AI知识库问答系统,提供开箱即用的功能,支持文档上传、在线文档爬取、文本自动拆分和向量化。用户可以快速嵌入MaxKB到第三方业务系...
阅读原文

La Plateforme

La Plateforme是Mistral AI公司推出AI开发工具,支持用户通过微调来优化AI模型,更好地适应特定的应用场景和数据集。在La Plateforme上用户能够用自己的数据...
阅读原文

GLM-4-long

GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调用。支持超长输入专为处理超长文本和记忆型任务设计,上下文长度...
阅读原文

Sync Labs

Sync Labs 是一款AI视频配音工具,使用 AI 技术实现了实时口型同步,支持用户将任何语言的音频与视频中的人物进行同步。Sync Labs支持多种语言,适用于电影、...
阅读原文

MDT-A2G

MDT-A2G是复旦大学和腾讯优图联合推出的AI模型,专门用于根据语音内容同步生成相应的手势动作。MDT-A2G模仿人类在交流时自然产生的手势,计算机能更加生动和...
阅读原文

Falcon Mamba 7B

Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...
阅读原文

醒蓝AI

醒蓝AI是一款AI照片生成工具,支持一键生成AI形象照,用户能够轻松制作工作形象照、写真照、证件照和AI换脸照片。醒蓝AI还提供API接口和定制化解决方案,满足...
阅读原文

UniTalker

UniTalker是推出的音频驱动3D面部动画生成模型,能根据输入的音频生成逼真的面部动作。采用统一的多头架构模型,用带有不同标注的数据集,支持多语言和多种音...
阅读原文
1141516171836