标签:上下文理解

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升级版 AI 视频生成工具,基于深度学习技术,能将图片或文字提示转化为高质量的视频内容。与前代版本相比,Pika 2.2 在功能和性...
阅读原文

Gemini Code Assist

Gemini Code Assist 是 Google 推出的 AI 编程工具,能帮助开发者更高效地编写代码、提升代码质量。Gemini Code Assist 基于 Gemini 2.0 模型,支持所有公开...
阅读原文

MME-CoT

MME-CoT 是香港中文大学(深圳)、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模...
阅读原文

ConverzAI

ConverzAI是基于AI技术优化招聘流程的平台。ConverzAI基于部署虚拟招聘人员(AI Agents),帮助企业在商业、医疗保健和专业招聘领域实现招聘流程的自动化和优...
阅读原文

AnyCharV

AnyCharV 是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角...
阅读原文

RAG-FiT

RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。RAG-FiT...
阅读原文

LlamaV-o1

LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型,旨在提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-...
阅读原文

什么是智能体RAG(Agentic RAG)

智能体RAG(Agentic RAG)是一种结合了AI智能体(Agent)和检索增强生成(RAG)系统的方法。它通过引入智能体框架来改变处理问答方式的技术。与仅依赖大模型...
阅读原文

日日新融合大模型

“日日新”融合大模型(SenseNova)是商汤科技于2025年1月10日正式推出的多模态大模型。模型实现了原生融合模态,深度推理能力与多模态信息处理能力均大幅提升...
阅读原文

NMT

NMT(No More Tuning)是UC Berkeley和阿里巴巴集团联合推出的多任务学习框架,能解决多任务学习中不同任务优先级优化的问题。NMT将多任务学习问题转化为约束...
阅读原文

Psi R0

Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环...
阅读原文

什么是上下文嵌入(Contextual Embedding)

上下文嵌入(Contextual Embedding)是一种将词汇映射到向量空间的技术,它为每个词生成一个基于其上下文的表示。这些表示能够捕捉词汇在不同上下文中的多样...
阅读原文

什么是上下文窗口(Context Window)

上下文窗口指的是在自然语言处理(NLP)任务中,模型在处理一个特定输入时所考虑的上下文信息的范围。具体来说,它决定了模型在生成或理解文本时,可以同时看...
阅读原文

Midscene.js

Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.js将执行...
阅读原文

什么是检索增强生成(Retrieval-Augmented Generation, RAG)

检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索(IR)和自然语言生成(NLG)的技术。它通过从外部知识库中检索相关信息来增强大...
阅读原文