标签:文本生成

MegaLLM

MegaLLM 是为开发者提供统一API接口的人工智能平台,可快速接入70多个主流大语言模型(LLMs),如GPT-5、Claude、Gemini、Llama等。通过一个API密钥,让开发...
阅读原文

Gemini 3 Flash

Gemini 3 Flash 是谷歌推出的高速、低成本的前沿智能模型。模型基于 Gemini 3 开发,性能显著提升,具备强大的推理能力和多模态理解能力。
阅读原文

A2UI

A2UI(Agent-to-User Interface)是谷歌开源的基于Agent的接口协议,用于AI与用户界面之间的交互。A2UI通过AI生成的JSON描述,让客户端原生渲染交互界面,无...
阅读原文

通义百聆

通义百聆是阿里通义实验室推出的企业级语音基座大模型,整合 Fun-ASR 语音识别和 Fun-CosyVoice 语音合成两大模型,专为复杂环境下的语音应用设计,通过 Cont...
阅读原文

LLaDA 2.0

LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次将参数规模扩展至 ...
阅读原文

Fara-7B

Fara-7B 是微软开源的专注于计算机使用的代理型小语言模型(SLM)。模型通过视觉感知网页,操作鼠标、键盘等界面元素来帮助用户完成任务,如填写表单、搜索信...
阅读原文

GPT-5.1

GPT-5.1 是 OpenAI 对 GPT-5 系列的升级版本,能提升智能性和沟通能力。GPT-5.1包含两个版本,GPT-5.1 Instant 和 GPT-5.1 Thinking。
阅读原文

ERNIE-4.5-VL

ERNIE-4.5-VL是百度文心开源的新一代多模态AI模型,基于ERNIE-4.5-VL-28B-A3B架构,激活参数3B,主打视觉语言理解与跨模态推理。模型通过海量视觉-语言数据训...
阅读原文

Emu3.5

Emu3.5(悟界·Emu3.5)是智源研究院发布的多模态世界大模型。通过在超过10万亿多模态Token(主要源自互联网视频,总时长约790年)上进行端到端预训练,学习并...
阅读原文

Pyscn

Pyscn 是专为 Python 开发者设计的智能代码质量分析工具,帮助开发者快速发现并清理代码中的问题,如死代码、重复代码、复杂代码结构等。通过控制流图(CFG)...
阅读原文

KAT-Dev-72B-Exp

KAT-Dev-72B-Exp 是快手推出的开源编程专用大语言模型,参数规模达720亿。模型是 KAT-Coder 的强化学习版本,专为软件工程任务设计。
阅读原文

UserLM-8b

UserLM-8b是微软推出的用户语言模型(User Language Model),专门用在模拟对话中的“用户”角色,不是常见的“助手”角色。
阅读原文

OpenLens AI

OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流...
阅读原文

FireRedChat

FireRedChat 是小红书智创音频团队开发的全双工语音交互系统,具有实时双向对话能力,支持可控打断功能。采用模块化设计,包括转录控制模块、交互模块和对话...
阅读原文

Claude Sonnet 4.5

Claude Sonnet 4.5 是 Anthropic 最新推出的最强编程模型。模型在编程、计算机操作、推理和数学等多个领域表现出色,在 SWE-bench Verified 测试中登顶,能专...
阅读原文
123414