AI工具

InternVL

InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViT-MLP-LLM 架构,通过视觉模块(如 InternViT)和语言模块(如...
阅读原文

wcplusPro

wcplusPro 是专业的微信公众号数据采集和分析工具,支持 Windows、macOS 和 Linux 系统,免安装、解压即用。wcplusPro支持采集任意公众号的历史文章及多种阅...
阅读原文

Instella

Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器层和3...
阅读原文

Maestro

Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,...
阅读原文

OLMo 2 32B

OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超越 GPT-...
阅读原文

Marker

Marker 是开源的高精度文档转换工具,专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。通过深度学习技术,自动去除页眉...
阅读原文

Fynix

Fynix 是专注于软件开发生命周期(SDLC)的 AI 工具,基于AI技术提升开发效率和代码质量。Fynix 提供 AI 代码助手、代码质量代理、SRE 代理和安全代理等多种...
阅读原文

UniFluid

UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成离散...
阅读原文

Multi-Speaker

Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的难题...
阅读原文

UniAct

UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接口差...
阅读原文

ReCamMaster

ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训练模型和帧维度条件机制,结合多相机同步数据...
阅读原文

AiSlides.chat

AiSlides.chat 是基于AI技术的对话式 PPT 制作工具。用户用自然语言输入需求或粘贴现有内容,AI 自动分析生成 PPT 大纲、逐页设计幻灯片,提供实时修改功能。...
阅读原文

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可以通过指定相机轨迹和多种动态路径(如...
阅读原文

Cube 3D

Cube 3D 是 Roblox 推出的AI 3D生成大模型,基于 AI 技术高效生成 3D 模型和环境。Cube 3D支持直接从文本描述生成完整的 3D 对象,与游戏引擎兼容。Cube 3D能...
阅读原文

AI Companion

AI Companion 是 Zoom 推出AI智能助手,基于记忆、推理、任务执行和协调四大功能,成为整个 Zoom 平台上的代理,帮助用户从重复繁琐的工作中解脱出来。AI Com...
阅读原文
12122232425208