标签:模型

AllenAI 开源了关于大模型的所有细节!数据、代码、参数、训练过程,完全复现

夕小瑶科技说 原创作者 | Tscom、Python开篇:OLMo的诞生与开放模型的重要性在人工智能领域,语言模型(LMs)的发展一直是推动自然语言处理(NLP)技术进步的...
阅读原文

ChatGPT 变懒最新解释!或和系统Prompt太长有关

夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。 ChatGPT变懒这件事又有了最新解释了。 这两天,推特用户Dylan Patel发文表示: 你想知道为什么 ChatGPT 和 ...
阅读原文

今日arXiv最热NLP大模型论文:基于语言模型模拟的经济学研究

夕小瑶科技说 原创作者 | 芒果、Python引言:经济选择预测的新视角在经济决策的预测领域,传统方法通常受限于获取人类选择数据的难度。实验经济学研究大多集...
阅读原文

斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了

来源:机器学习研究组订阅 在我们的工作群里,经常会有一位管理者来协调每个人的工作并汇总工作成果。近日,斯坦福大学的 Mirac Suzgun 和 OpenAI 的 Adam Ta...
阅读原文

AI 一天,人间一年:我与 AI 的 2023|甲子光年

总结2023,启程2024。作者|刘杨楠 苏霍伊 赵健 最近一两周,很多公司都在紧锣密鼓地开战略会,明确 2024 年的目标与规划。 经过一年多 AI 狂飙带来的推背感...
阅读原文

对AI原生应用做“逆向”后,我找到了大多数大模型厂商注定失败的原因

夕小瑶科技说 原创作者 | 卖萌酱大家好,我是卖萌酱。 在一整个2023年对大模型风风火火的流星赶月之后,大模型的竞逐已经来到了“下半场”。应接不暇推出一个又...
阅读原文

今日arXiv最热NLP大模型论文:大语言模型为什么始终会产生幻觉

夕小瑶科技说 原创作者 | 谢年年、python随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增...
阅读原文

计算机视觉算法,难以落地无人机航拍应用,why?

(谨以此文,献给那些涉及 AI 需求的产品经理,领导,以及某些不称职的算法工程师们) 今天来说点真话,不吐不快。 在ChatGPT 大模型到来之前,人工智能发展...
阅读原文

2024 年,谁能成为中国大模型的 F4?

2024年,哪家大模型公司更有看点?作者丨何思思 编辑丨陈彩娴 如果用一个词描述2023年大模型的发展,“疯狂”似乎再适合不过了。 2023年年初,大模型席卷了整个...
阅读原文

字节携扣子全体同仁祝全国人民新年快乐

2024年2月1日,字节跳动正式推出“Coze 扣子”AI Bot 。通过扣子都可以快速、低门槛地搭建自己的AI Chatbot,且平台支持将创建好的bot一键发布到豆包、飞书、微...
阅读原文

国内首个!最火的MoE大模型APP来了,免费下载,人人可玩

明敏 发自 凹非寺量子位 | 公众号 QbitAIMoE(混合专家)模型最近有多火,不用过多介绍了吧? 作为当下最顶尖、最前沿的大模型技术方向,MoE能在不增加推理成...
阅读原文

马斯克点赞SpaceX天才实习生:课余用AI上古卷轴,获Nature头版关注

克雷西 发自 凹非寺量子位 | 公众号 QbitAINature官网头版,最新刊发的是最新考古成果,轰动全球的成果—— 时隔2000年,上古卷轴(赫库兰尼姆卷轴)的神秘面纱...
阅读原文

阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源

白交 发自 凹非寺量子位 | 公众号 QbitAI阿里大模型,再次开源大放送—— 发布Qwen1.5版本,直接放出六种尺寸。 最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpa...
阅读原文

Perplexity CEO 专访:拥有十万用户的套壳产品比拥有自有模型却没有用户更有意义

上月初,Perplexity 完成了 B 轮融资,最新估值为 5.2 亿美元,这轮融资由 IVP 领投,NVIDIA 和 Jeff Bezos、NEA、Elad Gil、Nat Friedman 等跟投,Perplexit...
阅读原文

Moonshot AI 开放平台公测,API 与 OpenAI 兼容,提供「文件内容提取」能力接口

经过一段时间的内测,Moonshot AI 开放平台今天正式启动公开测试。 所有开发者都可以登录开放平台(platform.moonshot.cn)创建自己的 API Key,将 Kimi 智能...
阅读原文