AI工具

Temvideo.ai

Temvideo.ai 是面向商业用户的 AI 视频制作工具,通过智能算法帮助用户快速生成高质量的营销视频。用户只需提供想法和素材,AI 代理即可自动完成视频制作,包...
阅读原文

Vidi2

Vidi2是字节跳动推出的专注于视频理解和创作的多模态大语言模型。在多模态时间检索(TR)方面达到了行业领先水平,在时空定位(STG)和视频问答(Video QA)...
阅读原文

传声港

传声港是杭州龙投文化传媒有限公司旗下的AI驱动综合媒体服务平台,为企业提供一站式品牌传播与推广服务。平台整合了网络媒体、自媒体博主、网红达人等资源,...
阅读原文

Ito

Ito是开源的智能语音听写工具,通过其独特的“VibeTyping”技术,将用户的口语意图转换为精美文本。支持在邮件客户端、文档、聊天平台、浏览器和代码编辑器等各...
阅读原文

Talo

Talo 是先进的AI实时语音翻译工具,专为打破语言障碍设计,广泛应用于视频会议场景。支持超过60种语言的即时翻译,能无缝集成到Google Meet、Microsoft Teams...
阅读原文

GELab-Zero

GELab-Zero 是 StepFun 开发的开源 GUI Agent 模型,专注于移动设备的自动化交互和任务执行。具备本地可部署能力,支持在消费级硬件上运行 4B 模型,确保低延...
阅读原文

Spokenly

Spokenly 是为 Mac 和 iPhone 设计的智能语音听写应用,支持超过100种语言,具备自动语言检测功能,适合多语言用户和国际团队。提供“本地优先”模式,所有语音...
阅读原文

DeepSeek-Math-V2

DeepSeek-Math-V2 是 DeepSeek 团队推出的开源数学推理模型,能实现自我验证的数学推理。模型关注答案正确性,注重推理过程的严谨性。
阅读原文

闪电说

闪电说是端侧优先的AI语音输入法,主打极速响应和高效输入。工具通过本地语音模型实现毫秒级识别,无需联网,响应时间仅约0.2秒,比传统键盘打字快4倍。
阅读原文

StepAudio R1

StepAudio R1 是阶跃星辰团队推出的全球首个开源原生音频推理模型。模型通过创新的模态锚定推理蒸馏(MGRD)框架,解决了传统音频模型在复杂推理中性能下降的...
阅读原文

Uigenius

Uigenius是Uigenius.top推出的AI辅助UI/UX设计工具,专为设计师、产品经理及需要界面设计的人群打造。通过AI技术,将用户输入的文字描述快速转化为高保真原型...
阅读原文

Depth Anything 3

Depth Anything 3(DA3)是字节跳动Seed团队推出的视觉空间重建模型,通过单一Transformer架构实现从任意视角的视觉输入中恢复三维空间几何结构。
阅读原文

Z-Image

Z-Image 是阿里通义推出的图像生成模型,具有6B参数。模型包含三个变体:Z-Image-Turbo、Z-Image-Base 和 Z-Image-Edit,分别擅长快速推理、基础开发和图像编...
阅读原文

Dealism

Dealism 是创新的 AI 销售代理工具,专注于通过“氛围销售(Vibe Selling)”帮助企业提升销售效率和客户体验。通过分析企业的知识库、聊天记录和产品信息,学...
阅读原文

小凹语音输入法

小凹语音输入法(AutoTyper)是智谱推出的智能AI语音输入工具,通过语音输入即可高效创作,告别繁琐打字。支持多种风格表达,可任意DIY添加风格,适用于多种...
阅读原文
12345290