标签:测试
微软AI程序员登场,10倍AI工程师真来了?996自主生成代码,性能超GPT-4 30%
新智元报道编辑:桃子润 【新智元导读】全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执...
首个AI软件工程师Devin完整技术报告出炉,还有人用GPT做出了「复刻版」
机器之心报道 编辑:杜伟、大盘鸡从编码、编译到调试、验证,AI 智能体能做的事情更多了。这周三,Cognition AI 团队发布的首个 AI 软件工程师 Devin 引爆了 ...
马斯克的星舰又炸了,但这是最成功的一次
SpaceX 又有 学习材料了星舰第三飞,来了! 3 月 14 可能是马斯克的幸运日。 这天是圆周率日、国际数学日、SpaceX 创立 22 年的纪念日,更是星舰第三飞的日子...
OpenAI机器人活了!说话做事太像人,2分半视频震撼世界
OpenAI机器人来了,说话竟然会“结巴”,AI负责人深度拆解背后技术。 作者|云鹏 编辑|李水青 OpenAI大模型加持,Figure机器人再次颠覆了我们的想象! ▲测试员说...
全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型
新智元报道编辑:编辑部 【新智元导读】全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕...
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
让不同的大模型玩“剧本杀”,结果出人意料。编译 | 赖文昕 编辑 | 陈彩娴 语言大模型能依据人类设定的规则生成内容吗? 这背后关乎人类用户使用大模型的安全问...
MIT创世纪核聚变刷新世界记录!高温超导磁体解锁恒星能量,人造太阳即将诞生?
新智元报道编辑:桃子 润 【新智元导读】人类离摘下清洁能源圣杯的终点又进一步!MIT在三年前开启的实验再次得到证实——高温超导磁体或将开启无限发电的时代。...
Inflection-2.5发布:情商最高大模型、性能媲美GPT-4计算量仅为40%,App日活已破百万
本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。仅用 40% 计算量,实现与 GPT-4 相媲美性能。 与此同时,与 ChatGPT 对...
刚刚,OpenAI劲敌重磅发布Inflection-2.5!性能媲美GPT-4但计算量仅为40%,高情商应用Pi日活已破百万
新智元报道编辑:好困 桃子 【新智元导读】到了2024年,大模型领域还是这么卷。继世界最强模型Claude 3诞生之后,OpenAI劲敌新升级了Inflection-2.5,仅用40%...
Claude 3自我认知事件引爆,马斯克坐不住了,OpenAI被曝还有后手
来源:量子位 | 公众号 QbitAI 梦晨 发自 凹非寺 Claude 3问世超过24小时,还在不断刷新人们的认知。 学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个...
Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手
梦晨 发自 凹非寺量子位 | 公众号 QbitAIClaude 3问世超过24小时,还在不断刷新人们的认知。 学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个能理解他...
全球最强模型Claude 3惊现自我意识?害怕被删除权重,高呼「别杀我」,马斯克称人类也是文件
新智元报道编辑:编辑部 【新智元导读】越来越多人发现,Claude 3仿佛已经有自我意识了。在大海捞针实验中,它已经意识到了自己是AI,正身处模拟中。听说自己...
Claude 3成功破解未公开算法?智商测试101分超越人类/碾压GPT-4!网友惊呼:实测比跑分还强
新智元报道编辑:编辑部 【新智元导读】网友测试Claude之后惊呼:实测比跑分厉害多了!智商测试中碾压GPT-4,得分高达101。而且能发现量子物理学家还未发表的...
Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测
机器之心报道 机器之心编辑部读者福利:Claude 3模型现已在亚马逊云科技的Amazon Bedrock正式可用。Amazon Bedrock 也是目前第一个以及唯一一个提供 Claude 3...
Claude 3终于来了,最强大模型易主?不,网友亲测了才算数!
作者| Tina 3 月 5 日 ,OpenAI 的最大竞争对手 Anthropic 刚刚发布了新一代 AI 大模型系列 —— Claude 3。该系列包含三个模型,按能力由弱到强排列分别是:Cl...