标签：自然语言理解

ai-chatbot：构建高性能应用的开源AI机器人解决方案

ai-chatbot是Vercel推出的开源项目，基于Next.js框架和Vercel AI SDK构建。ai-chatbot提供一个功能完备、易于定制的AI聊天机器人模板，帮助开发者快速构建高...

阅读原文

AI工具

2年前 (2024)

Splitter.ai：智能音频分离技术助力音乐创作与制作

Splitter.ai 是先进的AI音频处理平台，能从音乐中分离乐器和人声。Splitter.ai 提供近乎完美的2 Stem分离、混响移除和直接从YouTube提取音频等功能。Splitter...

阅读原文

AI工具

2年前 (2024)

MewX AI

MewX AI是专业的AIGC生成式平台，支持用户用简单的文本描述创作艺术作品。平台适合各种水平的用户，包括专业设计师和AI新手，都能轻松使用。MewX AI提供多种...

阅读原文

AI工具

2年前 (2024)

VITA

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型（MLLM），能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型，扩展了中文词汇量，进行了...

阅读原文

AI项目和框架

2年前 (2024)

什么是NLP自然语言处理？定义、重要性、发展和应用

NLP（Natural Language Processing），即自然语言处理，是计算机科学的一个领域，重点是创建能够理解人类语音和语言的计算机和软件。NLP使用人工智能和机器学...

阅读原文

AI百科

2年前 (2024)

Mora

Mora是由来自微软和理海大学的研究人员推出的一个多智能体（AI Agents）框架，专门用于通用视频生成任务，目标是模拟并扩展OpenAI的Sora视频生成模型。该框架...

阅读原文

AI工具

2年前 (2024)

Phi-3

Phi-3是微软研究院推出的新一代系列先进的小语言模型，包括phi-3-mini、phi-3-small和phi-3-medium三个不同规模的版本。这些模型在保持较小的参数规模的同时...

阅读原文

AI工具

2年前 (2024)

混元DiT

混元DiT（Hunyuan-DiT）是由腾讯混元团队开发的一款高性能的文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够根据文本提示生成多分辨率的...

阅读原文

AI工具

2年前 (2024)

SAM 2

SAM 2（Segment Anything Model 2）是Meta推出的AI对象分割模型，专注于实时图像和视频对象分割。具备零样本泛化能力，能准确分割未知对象，并通过统一架构同...

阅读原文

AI项目和框架

2年前 (2024)

Mini-Monkey

Mini-Monkey是华中科技大学和华南理工大学联合推出的轻量级多模态AI模型。采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效解决了传统图像切分...

阅读原文

AI项目和框架

2年前 (2024)

Llama-3.1-Minitron

Llama-3.1-Minitron是由英伟达和Meta合作开发的AI模型，通过剪枝和知识蒸馏技术从Llama 3.1 8B模型精炼而成的更小型4B参数模型。这种优化减少了模型大小和复...

阅读原文

AI工具

2年前 (2024)

Ugic

Ugic是即时设计推出的Figma AI设计插件，能根据用户上传的组件库和设计系统，智能生成多语言的UI草稿。Ugic支持文本到结构的转换，允许用户输入PRD或描述文本...

阅读原文

AI工具

2年前 (2024)

Yodayo

Yodayo是一个面向动漫爱好者和虚拟主播（VTubers）的在线AI艺术创作平台。用户可以通过输入提示词和选择模型，轻松生成高质量的动漫风格艺术作品。

阅读原文

AI工具

2年前 (2024)

PGTFormer

PGTFormer是先进的视频人脸修复框架，通过解析引导的时间一致性变换器来恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，基于语义解析选择最...

阅读原文

AI工具

2年前 (2024)

什么是思维链（Chain of Thought，CoT）

思维链（Chain of Thought，CoT）是人工智能领域的一项突破性进展，通过模拟人类解决问题时的思考过程，赋予机器更深层次的逻辑推理能力。在面对需要多步骤逻...

阅读原文

AI百科

2年前 (2024)

1…3 456 7