标签:对话系统
揭开ChatGPT的神秘面纱:智能对话背后的秘密与未来趋势
本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域...
BlueLM-V-3B:ViVo与香港中文大学携手创新算法与系统协同设计方法提升产品智能化水平
BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸(2.7B语...
Florence-2:多功能视觉语言模型提升跨模态理解与应用能力
Florence-2 是微软 Azure AI 团队推出的多功能视觉模型,能执行图像描述、目标检测、视觉定位和图像分割等多种计算机视觉任务。Florence-2 基于 Transformer ...
Falcon Mamba 7B
Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...
GLM-4-Flash
GLM-4-Flash是智谱AI推出的首个免费大模型API,GLM-4-Flash不仅支持多轮对话和多语言处理,还具备网页浏览、代码执行等高级功能。开发者和企业可以在智谱AI开...
GLM-4-Plus
GLM-4-Plus是智谱AI最新推出的高智能旗舰大模型,在语言理解和长文本处理上取得突破,采用创新技术如PPO,显著提升推理和指令遵循能力。GLM-4-Plus在多个关键...
LTM-2-mini
LTM-2-mini是Magic公司推出的支持1亿token上下文AI模型,能处理相当于1000万行代码或750本小说的内容。LTM-2-mini采用序列维度算法,计算效率比Llama 3.1 405...
什么是序列到序列模型(Sequence-to-Sequence Model)
序列到序列模型(Sequence-to-Sequence Model),也称为编解码器模型,是一种处理可变长度输入和输出序列的深度学习模型。由两部分组成:编码器用于处理输入...