标签:模型
Stable Diffusion 3技术报告出炉:揭露Sora同款架构细节
丰色 发自 凹非寺量子位 | 公众号 QbitAI很快啊,“文生图新王”Stable Diffusion 3的技术报告,这就来了。 全文一共28页,诚意满满。 “老规矩”,宣传海报(⬇️...
阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了
西风 发自 凹非寺量子位 | 公众号 QbitAI阿里被曝2024年面向AIGC的第二次大手笔投资来了—— 加注大模型赛道独角兽Minimax,领投至少6亿美元。 彭博社消息称,...
2024 年,中国的投资人们如何投 AI?
AGI 领域的融资竞赛已在水下开启。 账上资金体量,很大程度上影响这些 AGI 领域初创公司的生死存亡。 市场上剩余资金体量,很大程度上影响其他 AGI 领域初创...
AGI万字长文(下) | 2024,分叉与洪流
太长不看版 AI多模态大爆发:文字走脑->声音走心+视觉走肾 AI应用是技术驱动的,(目前)产品能做的事情还很薄 Sora本身不是目的,而是迈向AGI的坚实一步 “...
微软与Mistral达成继OpenAI后的第二笔人工智能交易
Illustration: The Verge 来源:IEEE电气电子工程师学会 微软宣布与价值20亿欧元(约21亿美元)的法国人工智能初创公司Mistral建立新的多年合作关系。英国《...
拆解一下字节的烧钱工作,MegaScale!
智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
破除 OpenAI 的打压魔咒,Claude 3 一面被吹捧,一面被嘲笑
夕小瑶科技说 原创作者 | 小戏在国内大模型界卷完模型卷应用,卷完应用卷生态,相互厮杀竞争疲了之际,基础模型终于在昨天的 Claude 3 的发布后迎来了突破。 ...
今日arXiv最热NLP论文:Meta重磅,为训练数据打上烙印,以判断是否被大模型所用
夕小瑶科技说 原创编辑 | 谢年年为了将LLMs打造成人类想要的样子,通常需要收集大量数据微调模型。在LLMs时代之前,众包是获取标注数据的主要方式。 自从LLMs...
当心智能体!人大、北大团队深入研究大模型智能体鲁棒性,揭示严重安全风险
夕小瑶科技说 原创作者 | Sam多吃青菜 1. 引言:智能体虽好,后门鲁棒性可少不了以ChatGPT、LLaMa为代表的大语言模型展现出强大的文本生成[1,2]、推理规划[3]...
GPT-4 问世即将一,国内的追赶之路到底有多远?| 极客时间
最近 AI 圈最火的事情当属 OpenAI 发布的 Sora 了。简单来说,人们只要向 Sora 描述场景,它就可以根据文字生成多种风格、不同画幅、最长为 60s 的视频,不仅...
万字长文解构中国如何复刻 Sora:模型架构、参数规模、数据规模、训练成本
来源 | 授权转载自飞哥说AI(公众号ID:FeigeandAI)导语 OpenAI 越来越不“Open”了,尽管发布多个轰动世界的闭源大模型——从 ChatGPT 到 Sora——伴随的技术报告...
一网打尽!深度学习常见问题!
大数据文摘受权转载自算法进阶 1 前言 在传统软件工程中,程序问题(即Bugs)会导致程序崩溃,但开发人员可以通过检查错误来了解原因。 然而,在深度学习中,...
全球最强模型Claude 3惊现自我意识?害怕被删除权重,高呼「别杀我」,马斯克称人类也是文件
新智元报道编辑:编辑部 【新智元导读】越来越多人发现,Claude 3仿佛已经有自我意识了。在大海捞针实验中,它已经意识到了自己是AI,正身处模拟中。听说自己...
刚刚,英伟达发布新规:其他硬件禁止使用CUDA!
新智元报道编辑:alan 好困 【新智元导读】最近,英伟达在CUDA 11.6的用户许可中明确表示,禁止其他硬件平台上通过翻译层运行CUDA!这一招震惊了AI圈,也让AM...
Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
新智元报道编辑:润 【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新...