标签:能力

手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

新智元报道编辑:编辑部 【新智元导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,...
阅读原文

让「GPT-4V」跑在手机上,这家中国大模型公司做到了​

对标 GPT-4V,面壁让实时视频理解成功“跑”在端侧。作者 | 朱可轩 编辑 | 陈彩娴 真实世界的视觉信息是流动的,而在处理流动性的视觉信息上,端侧视频理解具有...
阅读原文

一文总结马斯克最新八小时访谈:Neuralink、xAI及人类未来​

大数据文摘授权转载自AI科技评论 整理:刘洁 编辑:岑峰 上周六,知名科技博客Lex Fridman邀请到了埃隆·马斯克(Elon Musk )以及Neuralink团队的其他成员进...
阅读原文

对话吴欣鸿:美图AI首先追求帮用户赚到钱,应用窗口期就2年

雷刚 白交 发自 凹非寺量子位 | 公众号 QbitAI在生成式AI浪潮中,场景玩家是易于忽视的群体,但往往又是低调中率先吃到红利的那一个。 在海外,不论微软还是A...
阅读原文

一文总结马斯克最新八小时访谈:Neuralink、xAI 及人类未来​

“如果我有Neuralink,我能一分钟看完六千字”整理丨刘洁 编辑丨岑峰 上周六,知名科技博客Lex Fridman邀请到了埃隆·马斯克(Elon Musk )以及Neuralink团队的...
阅读原文

大模型时代的操作系统:融合 Rust 和大模型,vivo 打造 AI 操作系统

采访嘉宾 |袁东 编辑 | Tina 每次技术革命,无论是个人电脑、互联网还是移动设备,总是从硬件开始,然后演化到软件层。而操作系统是计算机系统的核心,没有...
阅读原文

新王登基,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5

这次不卷模型大小,只卷性能。作者丨刘洁 编辑丨岑峰 lmsys官方在推特发布一则消息,恭喜DeepMind研发的Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名...
阅读原文

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

YuBo Ma 投稿量子位 | 公众号 QbitAI图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR,layout detection等方法对PDF长文档进行解析。但随着多...
阅读原文

谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o

机器之心报道 编辑:陈陈、小舟这么强的模型,谷歌给大家免费试用。近两日,谷歌在‍不断发布最新研究。继昨日放出最强端侧 Gemma 2 2B 小模型后,刚刚,Gemin...
阅读原文

Diffusion 反馈强势助力 CLIP 秒变火眼金睛:北京智源研究院、中科院自动化所联合推出 DIVA

本文分享论文Diffusion Feedback Helps CLIP See Better,专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。 作者:王文轩(中科院自动化所-...
阅读原文

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

机器之心原创 作者:杜伟如今的 AI 在识别人类情感方面发展到什么程度了?本月初,一场向更具情感 AI 发起挑战的高规格赛事落下了帷幕! 这就是第二届多模态...
阅读原文

国产多模态卷上下文长度:原生支持24K图文输入输出,图像视频理解对标GPT4V

陈林 投稿自 凹非寺量子位 | 公众号 QbitAI国产多模态大模型,也开始卷上下文长度。 书生·浦语灵笔(InternLM-XComposer)多模态大模型升级2.5版本—— 原生支...
阅读原文

全新生物学基准数据集LAB-Bench震撼开源!覆盖8大任务,超2.4K选择题

lü作者:十九 编辑:十九,李宝珠 FutureHouse Inc. 的研究人员推出了 LAB-Bench 生物学基准测试数据集,用于评估 AI 系统在文献检索和推理、图形解释、表格...
阅读原文

Karpathy:用表情包解释一下,为什么AI数不清Strawberry几个 r?

还记得这些天大模型被揪出来的低级错误吗? 不知道 13.11 和 13.8哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人...
阅读原文

日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?

机器之心报道 作者:蛋酱2024 年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史...
阅读原文
1101112131455