AI工具 - 第 109 页

混元-A13B

混元-A13B是腾讯最新推出的开源大语言模型，基于专家混合（MoE）架构，总参数量达800亿，激活参数为130亿。具备轻量级设计和高效推理能力，仅需1张中低端GPU...

阅读原文

AI工具

1年前 (2025)

Kling-Foley

Kling-Foley 是可灵 AI 推出的多模态视频生音效模型。模型将视频和文本提示作为条件输入，能生成与视频内容语义相关、时间同步的高质量立体声音频，涵盖音效...

阅读原文

AI工具

1年前 (2025)

4D-LRM

4D-LRM（Large Space-Time Reconstruction Model）是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意...

阅读原文

AI工具

1年前 (2025)

Doppl

Doppl是谷歌推出的实验性应用，基于AI技术帮助用户虚拟试穿服装。用户上传全身照片后，支持将服装照片或截图“穿”在数字版自己身上，Doppl能将静态图片转换为A...

阅读原文

AI工具

1年前 (2025)

AiBiao

AiBiao 是基于大语言模型技术的AI图表处理工具，通过自然语言交互帮助用户高效完成数据处理和分析工作。支持用户通过对话的方式进行数据查询、清洗、合并、计...

阅读原文

AI工具

1年前 (2025)

VLN-R1

VLN-R1是香港大学和上海人工智能实验室联合推出的全新具身智能框架，基于大型视觉语言模型（LVLM）直接将第一人称视频流转换为连续的导航动作。框架基于Habit...

阅读原文

AI工具

1年前 (2025)

clikka.ai

clikka.ai 是AI产品摄影工具。用户只需上传产品图片，30秒内能获得专业品质的照片。工具具备风格匹配功能，能基于上传风格参考照片，复制其灯光和氛围，实现...

阅读原文

AI工具

1年前 (2025)

迅雷MCP

迅雷MCP是迅雷推出的创新服务，将AI与数字内容下载深度融合。用户只需在支持该服务的AI应用（如纳米AI、扣子空间等）中发出指令，AI能自动找到所需资源启动下...

阅读原文

AI工具

1年前 (2025)

Nanonets-OCR-s

Nanonets-OCR-s（Nanonets OCR Small）是Nanonets推出的图像到 Markdown 的 OCR 模型，支持将图像中的文档内容转换为结构化的 Markdown 格式。模型能提取文本...

阅读原文

AI工具

1年前 (2025)

Kwai Keye-VL

Kwai Keye-VL 是快手自主研发的多模态大语言模型，基于 Qwen3-8B 语言模型整合SigLIP初始化的视觉编码器，支持动态分辨率输入。模型能深度融合和处理文本、图...

阅读原文

AI工具

1年前 (2025)

Game Worlds

Game Worlds 是 Runway 推出的 AI 游戏创作平台，通过 AI 技术帮助用户轻松创建个性化的游戏世界。平台支持用户通过简单的文本描述或上传图像，快速生成游戏...

阅读原文

AI工具

1年前 (2025)

Bob

Bob是为macOS平台设计的翻译和OCR软件。Bob支持多种翻译方式，包括划词翻译、截图翻译、输入翻译等，支持10+翻译服务，如Apple翻译、Google翻译、百度翻译等...

阅读原文

AI工具

1年前 (2025)

TicNote

TicNote 是出门问问推出的AI录音笔，定位为“随身AI思考伙伴”。采用卡片式设计，轻薄便携，配备磁吸保护套，可轻松携带或贴于手机背面。TicNote 搭载 Shadow A...

阅读原文

AI工具

1年前 (2025)

咔皮记账

咔皮记账是商汤科技推出的AI原生财务助手。咔皮记账以自动记账为核心功能，基于AI技术实现金额自动识别与分类，支持语音输入，让用户记账更便捷。咔皮记账能...

阅读原文

AI工具

1年前 (2025)

Gemini CLI

Gemini CLI 是谷歌开源的 AI Agent，将 Gemini 大模型融入开发者终端。Gemini CLI提供强大 AI 功能，如代码理解、文件操作、命令执行及动态排查问题，助力开...

阅读原文

AI工具

1年前 (2025)