AI大模型搜索之战开启,胜出黑马竟是ta?

新智元报道编辑:编辑部 【新智元导读】距离AI「杀死」搜索引擎,到底还差几步?几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉...
阅读原文

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

新智元报道编辑:桃子 好困 【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库...
阅读原文

AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码

新智元报道编辑:Aeneas 好困 【新智元导读】困扰全世界几个世纪的「臭名昭著」谜题——费马大定理,或将被AI攻克?一位英国数学家宣布,即将启动用Lean重现费...
阅读原文

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

新智元报道编辑:编辑部 【新智元导读】Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥...
阅读原文

36年前魔咒!Meta推出反向训练消除大模型「逆转诅咒」

新智元报道编辑:alan 【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实...
阅读原文

ZOMI酱:从艺术生到大模型训练专家|甲子光年

技术阿甘在不停奔跑。作者|苏霍伊 编辑|王博 一月的西伯利亚,寒风如刀。 ZOMI酱站在贝加尔湖的冰洞边缘,深吸一口冷冽的空气,让勇气充满胸腔,然后,潜入...
阅读原文

Scaling Laws又失灵了?谷歌新研究:扩散模型不是越大越好

大数据文摘授权转载自夕小瑶科技说作者:Zicy 近年来,模型规模呈现出愈来愈大的趋势,越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节,但...
阅读原文

有效识别63万个三维空间构型,清华大学牵头发布Uni-MOF模型,预测MOF吸附能力

大数据文摘授权转载自HyperAI超神经 作者:梅菜 编辑:李宝珠,三羊工业世界里,高纯气体被广泛应用于半导体制造、光纤生产、科学研究、医疗健康、环保能源等...
阅读原文

不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局

机器之心原创 作者:泽南、张倩不降低大模型算法精度,还能把芯片的算力利用效率提升 2~10 倍,这就是编译器的魅力。 在《沙丘》构建的未来世界里,「得香料...
阅读原文

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

机器之心报道 编辑:泽南、小舟「Real men program in C.」众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化...
阅读原文

2024年WAIC·云帆奖启航:擎启AGI时代,集结超越边界的探索者

2024 年 WAIC・云帆奖面向全球征选 AI 青年技术人才,欢迎点击「阅读原文」报名或提名。人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年,...
阅读原文

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

机器之心报道 编辑:陈萍、杜伟在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效...
阅读原文

CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

机器之心专栏 机器之心编辑部第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言 大语言模型(LLMs)的成功激发了计...
阅读原文

Agent开发+大模型微调,真的能让IT工程师薪资再起飞一次吗?

短短一年间,LLaMA,Mistral,智谱AI大模型,Grok等等大模型纷纷开源,相关开发与微调技术也在迅速迭代,RAG,LangChain,DeepSpeed,Megatron-LLM等框架的风...
阅读原文

iPhone上最强模型出现!性能超越GPT-4,Siri有救啦?

夕小瑶科技说 原创作者 | 任同学 你有多久没用你的Siri了呢?对于一个曾市值超过三万亿美元的科技巨头,苹果在人工智能方向上的实力还值得大家期待吗? 最近...
阅读原文