标签：语言

手机秒变超脑！微软Phi-3已经超越主流大模型！

点击上方蓝字关注我们“微软phi-3系列语言模型，尤其phi-3-mini，凭借创新数据集（精选网络数据与合成数据）和高效训练，实现小模型媲美Mixtral 8x7B、GPT-3.5...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热NLP大模型论文：浙江大学：蒸一蒸，多Agent变成单一模型，效果更好

夕小瑶科技说原创作者 | 谢年年“团结就是力量”，面对复杂多变的现实环境，multi-agent应运而生。相较于单打独斗的single-agent，multi-agent集结了多个功能...

阅读原文

AIGC动态

2年前 (2024)

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

Transformer本可以深谋远虑，但就是不做

机器之心报道机器之心编辑部语言模型是否会规划未来 token？这篇论文给你答案。「别让 Yann LeCun 看见了。」Yann LeCun 表示太迟了，他已经看到了。今天要...

阅读原文

AIGC动态

2年前 (2024)

生成式人工智能“瘦身”，进入便携消费电子产品

下一代亲密聊天机器人将在不需要连接互联网的情况下，以光速在个人笔记本电脑上运行。这至少是英特尔首席执行官帕特•格尔辛格（Pat Gelsinger）在2023年英特...

阅读原文

AIGC动态

2年前 (2024)

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

新智元报道编辑：flynne 【新智元导读】AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力，是继谷歌...

阅读原文

AIGC动态

2年前 (2024)

AI模型中文排名出炉！国产模型竟然…

点击上方蓝字关注我们“LMSYS Chatbot Arena的最新排名显示，中文模型意外地落后于其他模型，颠覆了人们对国产AI的预期。这一结果引发了对中文自然语言处理能...

阅读原文

AIGC动态

2年前 (2024)

OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型，Mac 即可运行！网友：真男人就该用C编程

编译｜核子可乐、Tina徒手用 1000 行 C 语言实现，不依赖庞大的外部库，Mac 即可运行。如今这年头，徒手写神经网络代码已经不算事儿了，现在流行手搓大模...

阅读原文

AIGC动态

2年前 (2024)

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

机器之心专栏机器之心编辑部最近，来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (L...

阅读原文

AIGC动态

2年前 (2024)

综述 | 清华大学刘知远团队剖析大语言模型时代的社会机遇与挑战

大语言模型时代的社会机遇与挑战陈慧敏，刘知远，孙茂松摘要大语言模型ChatGPT因其高度通用化和智能化的表现受到广泛社会关注，其引发的技术革命也正逐渐延...

阅读原文

AIGC动态

2年前 (2024)

凯文凯利2024最新演讲：帮助人类成为更好的人类，是人工智能的最终目标

3月29日，中信出版集团联合上海交通大学上海高级金融学院邀请到凯文凯利（K.K.）来到中国，展开一场精彩的线下对谈。读者们熟悉的K.K.，是《连线》杂志的创始...

阅读原文

AIGC动态

2年前 (2024)

为什么要纯C语言手搓GPT-2，Karpathy回应网友质疑

机器之心报道编辑：小舟Karpathy：for fun.几天前，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32...

阅读原文

AIGC动态

2年前 (2024)

大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA

蔚明投稿自凹非寺量子位 | 公众号 QbitAI大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测，超越一切传统时序模型。来自蒙纳士大学、蚂...

阅读原文

AIGC动态

2年前 (2024)

高薪必看：如何编写对大模型友好的代码？ | 极客时间

在最近的红杉 AI 峰会上，吴恩达教授深入剖析了 Agent Workflow 及其与大语言模型（LLM）结合的潜力。他提出，通过智能代理自动化任务，不仅能优化工作流程，...

阅读原文

AIGC动态

2年前 (2024)

1000行C语言搓出GPT-2！AI大神Karpathy新项目刚上线就狂揽2.5k星

新智元报道编辑：桃子好困【新智元导读】训大模型的方法可能要被革新了！AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2，而不再依赖庞大的GPT-2库...

阅读原文

AIGC动态

2年前 (2024)

1…11 121314 15…29