标签:多语言支持

Granola

Granola是专为频繁参加会议的人设计的AI会议助手工具。能实时转录会议内容,自动识别发言者并标注时间戳,支持用户在会议中实时添加笔记和标记重点。会议结束...
阅读原文

X-Prompt

X-Prompt是用于多模态视频目标分割的通用框架,解决传统方法在极端光照、快速运动和背景干扰等复杂场景下的局限性。通过预训练一个基于 RGB 数据的视频目标分...
阅读原文

BitsAI-CR

BitsAI-CR是字节跳动团队推出的基于大型语言模型(LLM)的自动化代码审查工具,通过两阶段处理流程实现高效代码审查:RuleChecker 负责基于 219 条规则检测潜...
阅读原文

Pipecat

Pipecat是开源的Python框架,专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音(TTS)和对话处理功能,简化AI服务的复杂协调、网络传输、音...
阅读原文

GLM-Realtime

GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分...
阅读原文

Aibiye

Aibiye是AI论文写作辅助平台,基于Multimodal+Global Thought Chain语言模型,为用户提供从开题报告到完整论文的生成服务。用户只需输入关键词、选择专业和字...
阅读原文

LlamaV-o1

LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型,旨在提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-...
阅读原文

Kokoro-TTS

Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯解码器设计,不使用扩散模型...
阅读原文

讯飞星火 X1

讯飞星火 X1 是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方式,仅...
阅读原文

星火语音同传大模型

星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准确度以及语言质量上均处于行业领先水...
阅读原文

Eko

Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计...
阅读原文

Banger

Banger是以AI翻唱为核心的AI音乐应用,用户能通过简单的步骤将喜欢的歌曲进行翻唱创作。应用内置了大量素材模板,引入个性化算法推荐功能,支持从YouTube提取...
阅读原文

码上飞

码上飞(CodeFlying)是无需编程基础的AI智能软件开发平台。用户只需用自然语言描述需求,AI能自动生成端到端的应用程序,从需求分析到代码生成、测试、部署...
阅读原文

新言意码

新言意码是专注于AI编程应用开发的公司,由前月之暗面海外产品Noisee的明超平创立。公司全称深圳新言意码科技有限公司,成立于2024年9月23日,位于广东省深圳...
阅读原文

PPTAgent

PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。PPTAgent分析...
阅读原文
1192021222360