标签:对话系统

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

OpenAI o3:OpenAI推出超强推理模型,智能提升与创新思维的完美结合

OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能(AGI),在ARC-AGI基准测试中得分高达87.5%,远超人...
阅读原文

狸谱:灵魂提取与创意壁纸的完美融合

狸谱(离谱小程序)是狸谱团队与国内顶尖AI公司阶跃星辰合作推出的AI小程序,命名为“灵魂提取器”。狸谱小程序能用拍照或上传图片,一键提取物体的灵魂,即生...
阅读原文

Takin AudioLLM:创新零样本语音生成模型助力个性化语音合成体验

Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型语言模型技术,专...
阅读原文

揭开ChatGPT的神秘面纱:智能对话背后的秘密与未来趋势

本文从基本概念出发,介绍和解释ChatGPT用到的一系列关键技术,如机器学习、神经网络、大模型、预训练+微调范式、Scaling Law……并对ChatGPT未来可能应用领域...
阅读原文

BlueLM-V-3B:ViVo与香港中文大学携手创新算法与系统协同设计方法提升产品智能化水平

BlueLM-V-3B是vivo AI Lab和香港中文大学MMLab联合推出的算法和系统协同设计方法,支持高效部署多模态大型语言模型(MLLM)至移动设备。模型以小尺寸(2.7B语...
阅读原文

Florence-2:多功能视觉语言模型提升跨模态理解与应用能力

Florence-2 是微软 Azure AI 团队推出的多功能视觉模型,能执行图像描述、目标检测、视觉定位和图像分割等多种计算机视觉任务。Florence-2 基于 Transformer ...
阅读原文

EMO

EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院的研究人员开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语...
阅读原文

Llama 3

Llama 3是Meta公司最新开源推出的新一代大型语言模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工智能领域的又一重大进步。作为Llama系列的第三...
阅读原文

DCLM-7B

DCLM-7B是由苹果公司联合研究团队推出的70亿参数开源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,苹果公司作为 DataComp-LM(DCLM)项目的研究机...
阅读原文

Llama3.1

Llama 3.1是Meta最新发布的开源AI模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参数量成为目前最大的开源模型之一。Llama 3.1支持128K的上下文长...
阅读原文

Falcon Mamba 7B

Falcon Mamba 7B是阿联酋技术创新研究所(TII)推出的开源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用编码器-解码器结构和多头注意...
阅读原文

书生·浦语

书生·浦语是上海人工智能实验室推出的开源AI大模型,具有卓越的推理能力和超长文本处理功能。书生·浦语支持高达一百万词元的文本输入,能自主进行网络搜索并...
阅读原文

LMMs-Eval

LMMs-Eval 是一个专为多模态AI模型设计的统一评估框架,提供标准化、广泛覆盖且成本效益高的模型性能评估解决方案。包含超过50个任务和10多个模型,通过透明...
阅读原文

GLM-4-Flash

GLM-4-Flash是智谱AI推出的首个免费大模型API,GLM-4-Flash不仅支持多轮对话和多语言处理,还具备网页浏览、代码执行等高级功能。开发者和企业可以在智谱AI开...
阅读原文
123