标签:文本生成

Mureka V8

Mureka V8是昆仑万维推出的AI音乐大模型,基于MusiCoT(Music Chain-of-Thought)技术架构,实现从声音拼接到类人创作逻辑的跨越。
阅读原文

MiniMax-M2-her

MiniMax-M2-her 是 MiniMax 专深度 AI 陪伴场景推出的角色扮演模型,是服务星野/Talkie 的底层模型。模型通过三大核心能力,独特的世界体验、有节奏的故事推...
阅读原文

Qwen3-Max-Thinking

Qwen3-Max-Thinking是阿里最新推出的千问旗舰推理模型,参数量超1万亿,预训练数据达36T Tokens。模型通过测试时扩展机制和强化学习,显著提升推理性能和效率...
阅读原文

GLM-4.7-Flash

GLM-4.7-Flash 是智谱开源、免费的混合思考模型,具有300亿参数和30亿激活参数。模型在性能与效率上达到平衡,尤其在编程、中文写作、翻译等多场景表现出色,...
阅读原文

Baichuan-M3

Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中均排名第一,超越了O...
阅读原文

GLM-4.7

GLM-4.7 是智谱AI推出的开源模型,专注于提升编码能力、推理能力和工具协同。模型在多语言编程、复杂任务规划、前端设计美学等方面表现出色,支持多种编程框...
阅读原文

VTP

VTP(Visual Tokenizer Pre-training)是MiniMax视频团队开源的视觉生成模型预训练框架。框架聚焦优化视觉tokenizer,通过融合对比学习、自监督学习和重建学...
阅读原文

MegaLLM

MegaLLM 是为开发者提供统一API接口的人工智能平台,可快速接入70多个主流大语言模型(LLMs),如GPT-5、Claude、Gemini、Llama等。通过一个API密钥,让开发...
阅读原文

Gemini 3 Flash

Gemini 3 Flash 是谷歌推出的高速、低成本的前沿智能模型。模型基于 Gemini 3 开发,性能显著提升,具备强大的推理能力和多模态理解能力。
阅读原文

A2UI

A2UI(Agent-to-User Interface)是谷歌开源的基于Agent的接口协议,用于AI与用户界面之间的交互。A2UI通过AI生成的JSON描述,让客户端原生渲染交互界面,无...
阅读原文

通义百聆

通义百聆是阿里通义实验室推出的企业级语音基座大模型,整合 Fun-ASR 语音识别和 Fun-CosyVoice 语音合成两大模型,专为复杂环境下的语音应用设计,通过 Cont...
阅读原文

LLaDA 2.0

LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次将参数规模扩展至 ...
阅读原文

Fara-7B

Fara-7B 是微软开源的专注于计算机使用的代理型小语言模型(SLM)。模型通过视觉感知网页,操作鼠标、键盘等界面元素来帮助用户完成任务,如填写表单、搜索信...
阅读原文

GPT-5.1

GPT-5.1 是 OpenAI 对 GPT-5 系列的升级版本,能提升智能性和沟通能力。GPT-5.1包含两个版本,GPT-5.1 Instant 和 GPT-5.1 Thinking。
阅读原文

ERNIE-4.5-VL

ERNIE-4.5-VL是百度文心开源的新一代多模态AI模型,基于ERNIE-4.5-VL-28B-A3B架构,激活参数3B,主打视觉语言理解与跨模态推理。模型通过海量视觉-语言数据训...
阅读原文
123415