标签:自然语言理解
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
Lyra:提升多模态交互体验的SmartMore创新解决方案
Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型(MLLM),专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多...
Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署
Large Action Models(LAMs)是微软推出大型行动模型的开发框架,能执行真实世界行动的智能系统,LAMs超越传统LLMs(Large Language Models,大型语言模型)...
EMOVA:华为诺亚方舟多模态处理模型全面提升智能交互与应用效率
EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、香港大学和华为诺亚方舟实验室等机构共同推出的。EMOVA能处理图像、...
Devika AI:智能AI助手助力高效执行复杂任务
Devika AI是印度Stition AI团队推出的开源AI软件开发工具,能理解并执行复杂的人类指令,将其分解为步骤,进行研究和信息搜集,最终编写代码以实现目标。Devi...
NVLM:英伟达推出的多模态大型语言模型赋能跨领域智能交互与应用
NVLM是NVIDIA推出的前沿多模态大型语言模型(LLMs),在视觉-语言任务上达到与顶尖专有模型(如GPT-4o)和开放访问模型(如Llama 3-V 405B和InternVL 2)相匹...
QwQ-32B-Preview:超越O1模型的阿里开源AI推理产品实现高效精准的智能决策
QwQ-32B-Preview(QwQ-32B)是阿里巴巴开源的实验性研究AI模型,以强大的推理能力著称,尤其在数学和编程领域表现卓越。QwQ-32B-Preview包含325亿参数,能处...
ACE:全能图像生成与编辑模型赋能创意无限可能
ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统一条件格...
MCP:Anthropic开源模型上下文协议的核心优势与创新特点
MCP(Model Context Protocol,模型上下文协议)是一个开放协议,是Anthropic开源的,能实现大型语言模型(LLM)应用与外部数据源和工具之间的无缝集成。基于...
BALROG:评估大型语言模型与视觉语言模型在复杂动态环境中推理能力的基准测试工具
BALROG是评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏...
TÜLU 3:开源指令遵循模型的创新特性与应用潜力
TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本,...
梅子Ai论文:智能学术论文生成工具的创新特点与应用分析
梅子Ai论文是专为学术写作设计的智能辅助工具,旨在帮助用户快速生成高质量的论文。能在短时间内自动生成论文大纲,支持多种论文类型,包括毕业论文、期刊论...
LaTRO:基于自我奖励机制的LLMs复杂推理能力提升框架
LaTRO(Latent Reasoning Optimization)是先进的框架,提升大型语言模型(LLMs)在复杂推理任务中的表现。基于将推理过程类比为从潜在分布中采样,用变分推...
代悟:智能搜索引擎助力开发者高效获取精准信息
代悟是专为开发者打造的AI搜索引擎。基于深度学习技术和知识图谱,帮助开发者快速、精准地获取技术信息和解决方案。基于整合海量的开发文档、代码库和社区问...
MATRIX-Gen:多智能体模拟系统引领智能决策新时代
MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的AI智能体组成的社会,生成多样化且高质量的训练...