标签:语言

手机秒变超脑!微软Phi-3已经超越主流大模型!

点击上方蓝字关注我们“微软phi-3系列语言模型,尤其phi-3-mini,凭借创新数据集(精选网络数据与合成数据)和高效训练,实现小模型媲美Mixtral 8x7B、GPT-3.5...
阅读原文

今日arXiv最热NLP大模型论文:浙江大学:蒸一蒸,多Agent变成单一模型,效果更好

夕小瑶科技说 原创作者 | 谢年年“团结就是力量”,面对复杂多变的现实环境,multi-agent应运而生。相较于单打独斗的single-agent,multi-agent集结了多个功能...
阅读原文

首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Transformer本可以深谋远虑,但就是不做

机器之心报道 机器之心编辑部语言模型是否会规划未来 token?这篇论文给你答案。 「别让 Yann LeCun 看见了。」Yann LeCun 表示太迟了,他已经看到了。今天要...
阅读原文

生成式人工智能“瘦身”,进入便携消费电子产品

下一代亲密聊天机器人将在不需要连接互联网的情况下,以光速在个人笔记本电脑上运行。 这至少是英特尔首席执行官帕特•格尔辛格(Pat Gelsinger)在2023年英特...
阅读原文

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

新智元报道编辑:flynne 【新智元导读】AI初创公司Reka最新推出的多模态语言模型Reka Core具备理解图像、音频和视频等多种模式数据内容的惊人能力,是继谷歌...
阅读原文

AI模型中文排名出炉!国产模型竟然…

点击上方蓝字关注我们“LMSYS Chatbot Arena的最新排名显示,中文模型意外地落后于其他模型,颠覆了人们对国产AI的预期。这一结果引发了对中文自然语言处理能...
阅读原文

OpenAI 创始成员用 1000 行 C 代码手搓了一个大模型,Mac 即可运行!网友:真男人就该用C编程

编译 | 核子可乐、Tina徒手用 1000 行 C 语言实现,不依赖庞大的外部库,Mac 即可运行。 如今这年头,徒手写神经网络代码已经不算事儿了,现在流行手搓大模...
阅读原文

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

机器之心专栏 机器之心编辑部最近,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (L...
阅读原文

综述 | 清华大学刘知远团队剖析大语言模型时代的社会机遇与挑战

大语言模型时代的社会机遇与挑战 陈慧敏,刘知远,孙茂松摘要大语言模型ChatGPT因其高度通用化和智能化的表现受到广泛社会关注,其引发的技术革命也正逐渐延...
阅读原文

凯文凯利2024最新演讲:帮助人类成为更好的人类,是人工智能的最终目标

3月29日,中信出版集团联合上海交通大学上海高级金融学院邀请到凯文凯利(K.K.)来到中国,展开一场精彩的线下对谈。读者们熟悉的K.K.,是《连线》杂志的创始...
阅读原文

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

机器之心报道 编辑:小舟Karpathy:for fun.几天前,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 发布了一个仅用 1000 行代码即可在 CPU/fp32...
阅读原文

大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA

蔚明 投稿自 凹非寺量子位 | 公众号 QbitAI大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。 来自蒙纳士大学、蚂...
阅读原文

高薪必看:如何编写对大模型友好的代码? | 极客时间

在最近的红杉 AI 峰会上,吴恩达教授深入剖析了 Agent Workflow 及其与大语言模型(LLM)结合的潜力。他提出,通过智能代理自动化任务,不仅能优化工作流程,...
阅读原文

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

新智元报道编辑:桃子 好困 【新智元导读】训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库...
阅读原文
1111213141529