声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025

多模态交互AI Agent应用,离不开RTC能力的支持
阅读原文

什么是光学字符识别(Optical Character Recognition, OCR)

光学字符识别(Optical Character Recognition,OCR)是一种将文本图像转换为机器可读格式的技术。通过自动数据提取,能快速识别扫描文档、相机图像和图像PDF...
阅读原文

什么是情感分类(Sentiment analysis)

情感分类(Sentiment analysis)也称为情感分析或意见挖掘,是一种自然语言处理技术,用于分析文本数据以识别和提取作者的情感倾向、观点和评价。通过评估文...
阅读原文

SmartPrep.AI

SmartPrep.AI是全球首个大模型原生教学辅助平台,为学校提供助教Agent,帮助教师高效备课,给学生提供定制化学伴,基于AI技术简化教师的备课流程,提高教学效...
阅读原文

ASAL

ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)系统。ASAL是Sakana AI及MIT、OpenAI等机构联合推出的,主要基于三种...
阅读原文

Freed

Freed 是AI医疗文档助手,基于先进的语音识别和自然语言处理技术,自动捕捉和转写医生与患者的对话内容,快速生成符合医疗规范的临床文档。Freed能减轻医生的...
阅读原文

什么是代理型AI(Agentic AI)

代理型AI(Agentic AI)是一种人工智能系统,能自主行动和决策。这些系统被称为AI代理,可以独立于直接人类干预追求目标。代理型AI使用高级技术,如强化学习...
阅读原文

QVQ

QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤...
阅读原文

2个月,11亿大模型大单,讯飞狂赚

历时210日,打造智算中心基础设施。
阅读原文

曝OpenAI布局实体机器人领域 行业是否面临重新洗牌?

原标题:曝OpenAI布局实体机器人领域 行业是否面临重新洗牌? 文章来源:人工智能学家 内容字数:8117字OpenAI进军实体机器人领域:AGI奇点临近? OpenAI近...
阅读原文

谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理

原标题:谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理 文章来源:人工智能学家 内容字数:8364字多模态大语言模型的空间推理能力研究 本...
阅读原文

对话首席AI科学家、图灵奖得主LeCun:大语言模型已触顶,Meta的下一代AI模型可能是新方向

原标题:对话首席AI科学家、图灵奖得主LeCun:大语言模型已触顶,Meta的下一代AI模型可能是新方向 文章来源:人工智能学家 内容字数:33028字Yann LeCun:关...
阅读原文