标签:自然语言处理

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到图像的自回归生成模型,基于连续标记和随机生成顺序的方法,在视觉质量和评估性能上取得突破性进展。模型在扩...
阅读原文

BiGR

BiGR是一种新型的条件图像生成模型,用紧凑的二进制潜在代码进行生成训练,增强图像的生成质量和表示能力。作为首个在同一框架内统一生成和判别任务的模型,B...
阅读原文

MoE++

MoE++是一种新型的混合专家(Mixture-of-Experts)架构,由昆仑万维2050研究院与北大袁粒团队联合推出。基于引入零计算量专家,即零专家、复制专家和常数专家...
阅读原文

Granite 3.0

Granite 3.0 是 IBM 推出的一系列先进的AI模型,能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用,能执行各种任务,包括文本生成、分...
阅读原文

OmniAI

OmniAI是一个强大的AI文档处理平台,基于先进的OCR技术,支持对PDF、DOCX、图片等多种文件格式进行快速处理和数据提取。平台支持用户轻松创建文档处理管道,...
阅读原文

ssemble

ssemble是一款运用人工智能技术的在线视频编辑平台,能将长视频智能切割成适合短视频平台的内容。通过AI驱动的内容识别,ssemble快速定位视频中的高光时刻,...
阅读原文

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 公司推出的一款新型人工智能模型,保持与前代 Claude 3 Haiku 相近的速度和成本的同时,实现了在各项能力上的提升,在多项基...
阅读原文

Act-One

Act-One 是 Runway推出的AI生成式角色表演工具,基于简单的视频输入生成富有表现力的角色表演。工具用生成式模型,将演员的现场表演转化为3D模型,适于动画流...
阅读原文

Janus

Janus是一个由DeepSeek AI推出的自回归框架,旨在统一多模态理解和生成任务。将视觉编码分离成不同的路径解决以往方法的局限性,且用单一的变换器架构进行处...
阅读原文

Kanana

Kanana是韩国即时通讯巨头Kakao推出的一款生成式AI助理,定位为用户的“AI伴侣”。能记住对话中的关键信息,根据上下文提供智能回应。Kanana分为两部分:Kana作...
阅读原文

Mellum

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型(LLM),旨在提升 AI 驱动的开发工具。通过深度集成 JetBrains IDE,提供低延迟、高准确度的代...
阅读原文

Vatic AI

Vatic AI是一款创新的人工智能视频生成工具,支持用户通过简单的操作将文本内容转换成视频。基于先进的AI技术,帮助用户释放创造力,快速制作出与文本内容相...
阅读原文

语鲸

语鲸(LingoWhale)是基于深言科技大模型能力的一款AI阅读工具,通过智能总结、问答、思维导图等功能,帮助用户快速把握文章核心内容和结构。工具支持多端同...
阅读原文

钛镁AI

钛镁AI是一家专注于企业级AIGC(人工智能生成内容)营销智能体平台的服务商。提供全链路的营销解决方案,包括市场洞察、广告创意、内容创作和舆情管理。钛镁A...
阅读原文

Moonshine

Moonshine是专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务。适于需要即时响应的应用场景,例如现场转录和语音命令识别。Moonshin...
阅读原文
1151617181923