标签：上下文理解

COMET

COMET是字节跳动推出的针对Mixture-of-Experts（MoE）模型的优化系统，能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术，COMET将通信...

阅读原文

AI工具

5个月前

BGE-VL

BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型，基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务，如图文检索和组合图像检...

阅读原文

AI工具

5个月前

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升级版 AI 视频生成工具，基于深度学习技术，能将图片或文字提示转化为高质量的视频内容。与前代版本相比，Pika 2.2 在功能和性...

阅读原文

AI工具

5个月前

Gemini Code Assist

Gemini Code Assist 是 Google 推出的 AI 编程工具，能帮助开发者更高效地编写代码、提升代码质量。Gemini Code Assist 基于 Gemini 2.0 模型，支持所有公开...

阅读原文

AI工具

6个月前

MME-CoT

MME-CoT 是香港中文大学（深圳）、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模...

阅读原文

AI工具

6个月前

ConverzAI

ConverzAI是基于AI技术优化招聘流程的平台。ConverzAI基于部署虚拟招聘人员（AI Agents），帮助企业在商业、医疗保健和专业招聘领域实现招聘流程的自动化和优...

阅读原文

AI工具

6个月前

AnyCharV

AnyCharV 是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架，能将任意参考角色图像与目标驱动视频相结合，生成高质量的角...

阅读原文

AI工具

6个月前

RAG-FiT

RAG-FiT（曾用名RAG Foundry）是英特尔实验室推出的开源框架，用在微调（fine-tuning）增强大型语言模型（LLMs）在检索增强生成（RAG）任务中的表现。RAG-FiT...

阅读原文

AI工具

6个月前

LlamaV-o1

LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型，旨在提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-...

阅读原文

AI工具

7个月前

什么是智能体RAG（Agentic RAG）

智能体RAG（Agentic RAG）是一种结合了AI智能体（Agent）和检索增强生成（RAG）系统的方法。它通过引入智能体框架来改变处理问答方式的技术。与仅依赖大模型...

阅读原文

AI百科

7个月前

日日新融合大模型

“日日新”融合大模型（SenseNova）是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态，深度推理能力与多模态信息处理能力均大幅提升...

阅读原文

AI工具

7个月前

NMT

NMT（No More Tuning）是UC Berkeley和阿里巴巴集团联合推出的多任务学习框架，能解决多任务学习中不同任务优先级优化的问题。NMT将多任务学习问题转化为约束...

阅读原文

AI工具

7个月前

Psi R0

Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作，能够将多个技能串联混训，生成具有推理能力的智能体，完成并闭环...

阅读原文

AI工具

7个月前

什么是上下文嵌入（Contextual Embedding）

上下文嵌入（Contextual Embedding）是一种将词汇映射到向量空间的技术，它为每个词生成一个基于其上下文的表示。这些表示能够捕捉词汇在不同上下文中的多样...

阅读原文

AI百科

8个月前

什么是上下文窗口（Context Window）

上下文窗口指的是在自然语言处理（NLP）任务中，模型在处理一个特定输入时所考虑的上下文信息的范围。具体来说，它决定了模型在生成或理解文本时，可以同时看...

阅读原文

AI百科

8个月前

123 4 5