标签:自然语言处理
Aqua Voice
Aqua Voice 是AI语音驱动的文档编辑工具。Aqua Voice支持将语音转换为文本,且支持用自然语言指令对文本进行编辑和格式化,如删除、重述、格式调整等。Aqua V...
豆包1.5·UI-TARS
豆包1.5·UI-TARS是字节豆包推出的面向图形界面交互(GUI)的Agent模型。模型基于感知、推理和动作执行等类人能力,与图形界面进行连续、流畅的交互。模型将视...
OpenAI o4-mini
OpenAI o4-mini 是OpenAI推出的小型推理模型,专为快速、经济高效的推理而优化。OpenAI o4-mini 在数学、编程和视觉任务方面表现出色,是 AIME 2024 和 2025 ...
Kimina-Prover
Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严谨地证明...
GLM-Z1-32B
GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型开发,基于深度优化训练,在数学、代...
Agent Development Kit
Agent Development Kit(ADK)是谷歌开源的首个AI智能体开发工具包,是一个代码优先的Python工具包,简化复杂AI代理的构建、评估和部署过程。ADK支持多智能体...
Skywork-OR1
Skywork-OR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。Skywork-OR1包含三款模型,...
Pika Twists
Pika Twists 是 Pika Labs 推出的 AI 视频编辑功能,能让用户轻松修改视频中的主体动作和场景,创造出奇幻效果。只需上传视频并描述需求,AI 可精准操控角色...
Multi-SWE-bench
Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript...
Gemini 2.5 Flash
Gemini 2.5 Flash 是 Google 推出的高效、低延迟的 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时,引入思考能力。