标签:能力

港中文 128 页全球首份 Gemini vs GPT-4V 多模态 PK 报告

2023 年 12 月 6 日,谷歌发布了最新一代的通用人工智能大模型 Gemini,并报告在多项测试中取得了最先进的结果,甚至在 MMLU 测试中首次取得了超过人类专家的...
阅读原文

折射OpenAI新一年技术路线图,透视Sam Altman的12个愿望清单

来源:CSDN(ID:CSDNnews) 整理:苏宓、袁滚滚 当地时间 12 月 24 日,Sam Altman 在X 平台上罕见地发起了一个「许愿池」, 「希望 OpenAI 在 2024 年构建/...
阅读原文

中国大模型爆发元年!AI界大佬共话LLM创新探索|新浪新闻探索大会

新智元报道编辑:桃子 好困 【新智元导读】AI时代,中国大模型进展到哪了?12月20日,「数字力量,探索无穹」2023探索大会上,新智元创始人&CEO杨静,与...
阅读原文

OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!

国科大&旷视团队 投稿量子位 | 公众号 QbitAI想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗...
阅读原文

大模型竟然能玩手机了,还能用软件修图:「AppAgent」会成为2024年的新趋势吗?

机器之心专栏 机器之心编辑部这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。 简单来说,AppAgent 的智能代理能力可以用于操作...
阅读原文

通往具身通用智能:如何让机器从自然模态中学习到世界模型?

目前的人工智能系统虽然强大,却常常缺乏人类和动物的常识和灵活推理能力。人工智能研究的最终目标,是让机器能够像人类一样思考、学习并解决各种任务,实现...
阅读原文

一文说尽「大模型推理」!12家高校机构联合发布150页报告,综述750篇论文

新智元报道编辑:LRS 好困 【新智元导读】全面综述近750篇「基础模型推理」论文,聚焦于各种推理任务、方法论和基准测试的最新进展,详细阐述大模型在各种推...
阅读原文

Rokid祝铭明:未来5年,希望把所有人的眼镜换成智能眼镜 | MEET2024

编辑部 整理自 MEET2024量子位 | 公众号 QbitAI彭博社马克·古尔曼(Mark Gurman)消息,苹果2024年的重点是Vision Pro等,而非iPhone。 爆料称,苹果坚信Visi...
阅读原文

谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告

happy投稿量子位 | 公众号 QbitAI谷歌扳回一局! 在Gemini开放API不到一周的时间,港中文等机构就完成评测,联合发布了多达128页的报告,结果显示: 在37个视...
阅读原文

大模型嵌入学习机,打破教育的“不可能三角”

AI正重新定义教育行业,让大规模的因材施教成为可能。 作者|程茜 编辑|漠影 大家常说,作业是影响家庭和谐的“罪魁祸首”。一到写作业时间,家里往往鸡飞狗跳还...
阅读原文

爱范儿 2024 招聘 | 在一个创造力爆棚的公司成为超级个体

在 AIGC 的真实和幻觉中和世界周旋一年后,我们即将再次出发。 爱范儿希望招募更多与我们同行的优秀创作者,期待与你相遇。 🚀 爱范儿是怎么样的一家公司? 爱...
阅读原文

子曰教育大模型加速落地应用:推出虚拟人AI产品,新增口语定级等功能

作者 | 凌敏 12 月 15 日,教育科技公司网易有道公布了全球首个虚拟人口语教练 Hi Echo 的 2.0 版本。Hi Echo 是全球首个虚拟人口语私教,于今年 10 月正式...
阅读原文

开创全新通用3D大模型,VAST将3D生成带入「秒级」时代

机器之心报道 机器之心编辑部生成式 AI 在 3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。 传统 3D 建模涉及游戏、影视、建筑等多个行业,普遍依赖...
阅读原文

谷歌Gemini技术报告出炉,作者多达900余人

机器之心报道 机器之心编辑部从此以后,Google Scholar 数据该出问题了。备受期待的谷歌 Gemini 技术报告完整版,今天终于出炉了。两周前,人们兴奋于谷歌提...
阅读原文

开源+共训,双轮驱动基础大模型创新普惠 |浪潮信息吴韶华@MEET2024

编辑部 整理自 MEET2024量子位 | 公众号 QbitAI相比GPT-3,GPT-4(包括GPT-3.5)的能力有了非常巨大的进步。 这背后其实得益于一个很重要的过程引入:微调。 ...
阅读原文
1383940414255