AI工具

MineContext

MineContext 是字节跳动开源的主动式上下文感知 AI 工具,通过挖掘数字生活中的“方块”,帮助用户高效管理知识和信息。每 5 秒截取一次屏幕,经过处理后,批量...
阅读原文

NeuTTS Air

NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS(文本到语音)模型。具备高拟真语音合成能力,声音自然流畅,几乎能以假乱真。支持本地运行,提供 ...
阅读原文

Instruct

Instruct 是无代码 AI 自动化平台,用户只需用自然语言描述任务,能快速创建、运行 AI Agent,无需编写代码或设计复杂流程。
阅读原文

AladdinEdu

AladdinEdu 是九章云极旗下面向高校科研场景的高性能 GPU 算力服务平台。平台提供多种套餐,支持 DC100(Hopper)显卡,具备大显存和高算力,适合大模型训练。
阅读原文

Paper2Video

Paper2Video 是新加坡国立大学 Show Lab 开发的项目,从学术论文自动生成演示视频。通过 PaperTalker 多智能体框架,将论文转化为包含幻灯片、字幕、语音和演...
阅读原文

KAT-Dev-72B-Exp

KAT-Dev-72B-Exp 是快手推出的开源编程专用大语言模型,参数规模达720亿。模型是 KAT-Coder 的强化学习版本,专为软件工程任务设计。
阅读原文

Caesr

Caesr是智能自动化工具,能在电脑、手机和网页环境中像人类一样操作设备。工具通过视觉识别、点击按钮、填写表单等方式完成任务,无需依赖API或复杂脚本。Cae...
阅读原文

Androidify

Androidify 是谷歌推出的一个开源项目,帮助开发者学习如何在 Android 上构建 AI 驱动的应用。项目使用了谷歌最新的技术,如 Jetpack Compose、Gemini API(...
阅读原文

Jamba Reasoning 3B

Jamba Reasoning 3B 是 AI21 Labs 推出的轻量级高效推理模型,拥有 30 亿参数和 256K 的超长上下文处理能力。模型用混合 Transformer-Mamba 架构,结合注意力...
阅读原文

UserLM-8b

UserLM-8b是微软推出的用户语言模型(User Language Model),专门用在模拟对话中的“用户”角色,不是常见的“助手”角色。
阅读原文

Gemini Enterprise

Gemini Enterprise 是 Google Cloud 推出的企业级 AI 平台,通过直观的聊天界面将 Google 顶尖的 AI 技术融入企业工作流程。平台能连接企业所有数据、工具和...
阅读原文

Imagine v0.9

Imagine v0.9 是 xAI 公司推出的最新视频生成模型。模型能在不到20秒内生成6秒左右的视频,支持运动控制、动态相机效果、自然对话添加等功能,且配备语音优先...
阅读原文

OpenAgents

OpenAgents 是用在构建AI Agent网络的开源框架,将Agent连接到网络实现开放式协作。框架通过创建持久化的Agent网络,让Agent能像人类一样长期在线、相互协作...
阅读原文

Ling-1T

Ling-1T 是蚂蚁集团开源的万亿参数语言模型,定位为“旗舰级非思考模型”。基于 MoE(Mixture of Experts)架构,拥有 1 万亿参数,每次推理激活约 510 亿参数...
阅读原文

Gemini 2.5 Computer Use

Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的计算机使用模型。模型能让 AI 直接控制浏览器,执行点击、滚动和输入等操作。
阅读原文
134567279