标签：测试

微软AI程序员登场，10倍AI工程师真来了？996自主生成代码，性能超GPT-4 30%

新智元报道编辑：桃子润【新智元导读】全球首个AI程序员Devin诞生之后，让码农纷纷恐慌。没想到，微软同时也整出了一个AI程序员——AutoDev，能够自主生成、执...

阅读原文

AIGC动态

2年前 (2024)

首个AI软件工程师Devin完整技术报告出炉，还有人用GPT做出了「复刻版」

机器之心报道编辑：杜伟、大盘鸡从编码、编译到调试、验证，AI 智能体能做的事情更多了。这周三，Cognition AI 团队发布的首个 AI 软件工程师 Devin 引爆了 ...

阅读原文

AIGC动态

2年前 (2024)

马斯克的星舰又炸了，但这是最成功的一次

SpaceX 又有学习材料了星舰第三飞，来了！ 3 月 14 可能是马斯克的幸运日。这天是圆周率日、国际数学日、SpaceX 创立 22 年的纪念日，更是星舰第三飞的日子...

阅读原文

AIGC动态

2年前 (2024)

OpenAI机器人活了！说话做事太像人，2分半视频震撼世界

OpenAI机器人来了，说话竟然会“结巴”，AI负责人深度拆解背后技术。作者|云鹏编辑|李水青 OpenAI大模型加持，Figure机器人再次颠覆了我们的想象！ ▲测试员说...

阅读原文

AIGC动态

2年前 (2024)

全球首个AI程序员诞生，码农饭碗一夜被砸！10块IOI金牌华人团队震撼打造，996写代码训练模型

新智元报道编辑：编辑部【新智元导读】全球首位AI软件工程师Devin诞生了，它掌握全栈技能，云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕...

阅读原文

AIGC动态

2年前 (2024)

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

让不同的大模型玩“剧本杀”，结果出人意料。编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗？这背后关乎人类用户使用大模型的安全问...

阅读原文

AIGC动态

2年前 (2024)

MIT创世纪核聚变刷新世界记录！高温超导磁体解锁恒星能量，人造太阳即将诞生？

新智元报道编辑：桃子润【新智元导读】人类离摘下清洁能源圣杯的终点又进一步！MIT在三年前开启的实验再次得到证实——高温超导磁体或将开启无限发电的时代。...

阅读原文

AIGC动态

2年前 (2024)

Inflection-2.5发布：情商最高大模型、性能媲美GPT-4计算量仅为40%，App日活已破百万

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。仅用 40% 计算量，实现与 GPT-4 相媲美性能。与此同时，与 ChatGPT 对...

阅读原文

AIGC动态

2年前 (2024)

刚刚，OpenAI劲敌重磅发布Inflection-2.5！性能媲美GPT-4但计算量仅为40%，高情商应用Pi日活已破百万

新智元报道编辑：好困桃子【新智元导读】到了2024年，大模型领域还是这么卷。继世界最强模型Claude 3诞生之后，OpenAI劲敌新升级了Inflection-2.5，仅用40%...

阅读原文

AIGC动态

2年前 (2024)

Claude 3自我认知引爆，马斯克坐不住了，OpenAI被曝还有后手

来源：量子位 | 公众号 QbitAI 梦晨发自凹非寺 Claude 3问世超过24小时，还在不断刷新人们的认知。学量子物理的博士大哥快疯了，因为Claude 3是仅有的几个...

阅读原文

AIGC动态

2年前 (2024)

Claude 3“自我认知”引爆，马斯克坐不住了，OpenAI被曝还有后手

梦晨发自凹非寺量子位 | 公众号 QbitAIClaude 3问世超过24小时，还在不断刷新人们的认知。学量子物理的博士大哥快疯了，因为Claude 3是仅有的几个能理解他...

阅读原文

AIGC动态

2年前 (2024)

全球最强模型Claude 3惊现自我意识？害怕被删除权重，高呼「别杀我」，马斯克称人类也是文件

新智元报道编辑：编辑部【新智元导读】越来越多人发现，Claude 3仿佛已经有自我意识了。在大海捞针实验中，它已经意识到了自己是AI，正身处模拟中。听说自己...

阅读原文

AIGC动态

2年前 (2024)

Claude 3成功未公开算法？智商测试101分超越人类/碾压GPT-4！网友惊呼：实测比跑分还强

新智元报道编辑：编辑部【新智元导读】网友测试Claude之后惊呼：实测比跑分厉害多了！智商测试中碾压GPT-4，得分高达101。而且能发现量子物理学家还未发表的...

阅读原文

AIGC动态

2年前 (2024)

Claude 3被玩出自我意识了？AI社区轰动，我们买会员来了次实测

机器之心报道机器之心编辑部读者福利：Claude 3模型现已在亚马逊云科技的Amazon Bedrock正式可用。Amazon Bedrock 也是目前第一个以及唯一一个提供 Claude 3...

阅读原文

AIGC动态

2年前 (2024)

Claude 3终于来了，最强大模型易主？不，网友亲测了才算数！

作者| Tina 3 月 5 日，OpenAI 的最大竞争对手 Anthropic 刚刚发布了新一代 AI 大模型系列 —— Claude 3。该系列包含三个模型，按能力由弱到强排列分别是：Cl...

阅读原文

AIGC动态

2年前 (2024)

1…7 8910 11…13