标签:多模态大模型

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路

原标题:大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路 文章来源:人工智能学家 内容字数:24587字大型语言模型(LLM)发展简史:...
阅读原文

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

第一个结合SAM-2和LLaVA-like的视频多模态大模型。
阅读原文

反超 DeepSeek-V3,新发布的 Qwen2.5-Max 到底有多牛?

登上大模型盲测榜单全球前十,数学及编程能力夺冠。
阅读原文

年末重磅!ByteDance Research视频理解大模型「眼镜猴」正式发布

补齐多模态最后一块短板,Tarsier2 反超 GPT4o、Gemini-1.5-Pro!
阅读原文

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

由月更加速到日更,阶跃模型迭代驶入「快车道」。
阅读原文

前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚是计算机视觉领域通用架构Swim Transformer的核心作者之一。
阅读原文

谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理

原标题:谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理 文章来源:人工智能学家 内容字数:8364字多模态大语言模型的空间推理能力研究 本...
阅读原文

决策背后的秘密:探索首个多模态大模型的魔法与科学之谜

首个深入探索多模态大模型(MLLM)的可解释性综述,从数据、模型、训练推理多个视角剖析多模态人工智能的决策逻辑,揭示其 “魔法” 背后的科学依据。
阅读原文

天池 Better Synth 多模态大模型数据合成挑战赛盛大开幕

原标题:天池 Better Synth 多模态大模型数据合成挑战赛盛大开幕 文章来源:小夏聊AIGC 内容字数:3565字第四届 Data-Juicer 数据挑战赛盛大开启 据AITOP100...
阅读原文

颠覆性技术:将多模态大模型计算量削减至惊人的12%!

本文在 Qwen2-VL 和 InternVL2.0 上验证了此种剪枝策略的普适性。
阅读原文
12