AI工具

Mercury Coder

Mercury Coder 是 Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式...
阅读原文

Browser Operator

Browser Operator 是 Opera 浏览器推出的 AI 驱动的智能代理工具,通过自然语言指令帮助用户更高效地完成网页浏览任务。用户只需输入简单的指令,如“购买商品...
阅读原文

VDraw

VDraw是基于AI技术的信息图表生成工具,帮助用户将文字、文件或视频内容快速转化为专业且个性化的视觉内容。用户能对生成的图表进行个性化定制,包括修改颜色...
阅读原文

Pinch

Pinch 是创新的实时 AI 语音翻译视频会议平台,专为打破语言障碍而设计,支持超过 30 种语言的即时语音翻译。提供两种翻译模式:口译模式和同声传译模式,分...
阅读原文

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种...
阅读原文

Microsoft Dragon Copilot

Microsoft Dragon Copilot 是微软推出的面向医疗行业的AI语音助手,帮助临床医生简化临床文档处理、信息检索和任务自动化。Microsoft Dragon Copilot 结合 Dr...
阅读原文

SuperGPQA

SuperGPQA 是字节跳动豆包大模型团队联合 M-A-P 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科覆盖...
阅读原文

SpeciesNet

SpeciesNet 是 Google 开源的人工智能模型,通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成,能识别超过 2000 种标签,包括动物...
阅读原文

GaussianCity

GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的 BEV-Point 表示方法,将场景的显存(VRA...
阅读原文

Asyncflow v1.0

Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项,能为文本内容生成高质量的语音朗读,适用于多种语言和风格。
阅读原文

NextGenAI

NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构,Ope...
阅读原文

UX Pilot

UX Pilot 是 AI 驱动的 UX/UI 设计工具,基于AI技术简化和加速设计流程。UX Pilot 根据文本提示快速生成从低保真线框图到高保真界面的设计,支持智能调整视觉...
阅读原文

NotaGen

NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。NotaGen 基于...
阅读原文

DiffRhythm

DiffRhythm 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)技术,能快速生成包含人声和伴奏的完整...
阅读原文

OmniAlign-V

OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质量数据...
阅读原文
12930313233208