AI工具
Mercury Coder
Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...
Browser Operator
Browser Operator 是 Opera 浏览器推出的 AI 驱动的智能代理工具,通过自然语言指令帮助用户更高效地完成网页浏览任务。用户只需输入简单的指令,如“购买商品...
Mistral OCR
Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种...
Microsoft Dragon Copilot
Microsoft Dragon Copilot 是微软推出的面向医疗行业的AI语音助手,帮助临床医生简化临床文档处理、信息检索和任务自动化。Microsoft Dragon Copilot 结合 Dr...
SpeciesNet
SpeciesNet 是 Google 开源的人工智能模型,通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成,能识别超过 2000 种标签,包括动物...
GaussianCity
GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的 BEV-Point 表示方法,将场景的显存(VRA...
Asyncflow v1.0
Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项,能为文本内容生成高质量的语音朗读,适用于多种语言和风格。
DiffRhythm
DiffRhythm 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)技术,能快速生成包含人声和伴奏的完整...
OmniAlign-V
OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质量数据...