标签:模型
LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告
新智元报道编辑:编辑部 【新智元导读】大语言模型提示中,竟有不少「怪癖」:重复某些内容,准确性就大大提高;人名变匿名,准确性就大大下降。最近,马里兰...
树莓派上部署RAG!微软Phi-3技术报告揭示「小而美」模型如何诞生
新智元报道编辑:乔杨 好困 【新智元导读】Build大会召开两周之后,微软更新了Phi-3系列模型的技术报告。不仅加入最新的基准测试结果,而且对小模型、高性能...
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
机器之心发布 机器之心编辑部2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Gener...
大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4
机器之心报道 编辑:陈萍、杜伟通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选...
字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
精准预测房价!浙大GIS实验室提出osp-GNNWR模型:准确描述复杂空间过程和地理现象
作者:梅菜 编辑:李宝珠,三羊 浙江大学 GIS 重点实验室通过引入优化的空间邻近度指标并将其融入神经网络架构,提升了模型对房价预测的准确性。住房是人类福...
2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源
高质量的指令数据是训练和优化大语言模型不可或缺的资源,是提升模型性能的基石。近日,北京智源人工智能研究院发布了千万级高质量指令微调数据集开源项目 In...
张俊林:关于Scaling Law、半合成数据、MOE及长文本
直播预告 | 6月18日上午10点,「智猩猩AI新青年讲座」第240讲正式开讲,邀请到德州大学奥斯汀分校刘星超博士将直播讲解《利用直线概率流加速Stable Diffusion...
小红书招聘年龄底线35岁,猎头:超32岁基本没戏;小米汽车员工实发工资曝光,年入百万不是梦;极目银河老板欠62亿跑路 |AI周报
整理 | 褚杏娟、傅宇琪小米汽车员工实发工资曝光,年入百万不是梦;小红书招聘年龄底线是 35 岁,猎头称超过 32 岁基本没戏了;中国版 Sora“可灵”火爆外网,...
Yandex 开源 LLM 训练工具,可节省高达 20% 的 GPU 资源
2024 年 6 月 11 日,莫斯科跨国科技公司 Yandex 最近推出了一种用于训练大型语言模型 (LLM) 的开源方法 YaFSDP, 用于增强 GPU 通信并减少 LLM 训练中的内存...
北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源
杨灵 投稿自 凹非寺量子位 | 公众号 QbitAI如何生成高难度、指令超复杂的视频呢? 北大与快手AI有解了,他们提出新框架VideoTetris,就像拼俄罗斯方块一样,...
1分钟内完成报销核对,微软AI Day现场展示Copilot生产力
西风 发自 凹非寺量子位 | 公众号 QbitAI微软Build大会前脚刚放出一箩筐生产力革命最新进展:自定义Copilot、Team Copilot、Copilot扩展…… 这两天在微软AI Da...
37项SOTA!全模态预训练范式MiCo:理解任何模态并学习通用表示|港中文&中科院
MiCo团队 投稿量子位 | 公众号 QbitAIGPT-4o掀起一股全模态(Omni-modal)热潮,去年的热词多模态仿佛已经不够看了。 要构建全模态智能,意味着能够理解任何...
GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界
新智元报道编辑:桃子乔杨 【新智元导读】大模型是世界模型吗?UA微软等机构最新研究发现,GPT-4在复杂环境的模拟中,准确率甚至不及60%。对此,LeCun激动地...