标签:模型
2024属于小模型时代?TinyLlama 等小模型爆火
直播预告 | 明晚(周三)7点,「多模态大模型线上闭门会」正式开讲!阿里巴巴通义实验室 NLP 高级算法专家严明参与出品,携手刘兆洋、李彦玮、文束三位青年学者...
ICRA 2024 | 首届RoboDrive自动驾驶挑战赛
首届“RoboDrive”自动驾驶挑战赛将于 The 41st IEEE Conference on Robotics and Automation (ICRA 2024) 期间举办,欢迎大家了解及参与!竞赛主页:https://r...
苹果关闭圣地亚哥AI团队;罗永浩公司辟谣转做大模型;Meta承认用盗版书籍训练AI丨AIGC大事日报
01/15 全球AIGC产业要闻 1、苹果关闭圣地亚哥AI团队 2、Meta承认用盗版书籍训练AI但否认侵权 3、罗永浩公司辟谣转做大模型 4、阿里发布AI图像内容替换框架Rep...
对话联想中国区总裁刘军:全栈智能布局已有7年,联想不会做通用大模型
AI PC的落地、兴起、普及所撬动的不仅仅是PC产业里像联想这样核心玩家的业务,最终影响的是大众在使用PC作为生产力工具的全新使用体验和玩法,而这一改变才刚...
Sam Altman:GPT-5 将有指数级跃升,人类已经非常接近 AGI | Hunt Good 周报
欢迎收看最新一期的Hunt Good周报!在本期内容你会看到: 4 条新鲜资讯3 个有用工具3 个鲜明观点1 个有趣案例 Hunt for News|先进头条 💥 GPT Store 上线,Op...
CES 2024:AI硬件「狂欢」的背后,是噱头大于实用的大模型落地困境
文章转载自「极客公园」2024 年年初,我们迎来了第一个真正意义上的疫情封控后的 CES。 今年中国的参展公司和观展人数是近几年来的一个小高峰。CES 官方发布...
我们是怎么一步步被Hugging Face收购的:开源库Gradio构建者分享背后故事
机器之心编译 机器之心编辑部Gradio CEO 兼联合创始人 Abubakar Abid 谈了谈 Gradio 被收购的内幕故事。 不知大家是否还记得 2021 年年末,Hugging Face 宣布...
深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐
机器之心专栏 机器之心编辑部继第一份大模型对齐技术报告(Secrets of RLHF in Large Language Models Part I)获 NeurIPS 2023 workshop best paper 后,第...
央企第一家:中国电信开源星辰语义大模型,共享超1T 高质基础数据
机器之心原创 作者:吴昕2024 年伊始,中国电信开源星辰语义大模型- 7B,成为第一家开源大模型的央企。同时开源的还有超 1T 的高质量清洗基础数据。 随着新一...
Transformer的无限之路:位置编码视角下的长度外推综述
机器之心专栏 机器之心编辑部在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而,...
谷歌被指控 TPU芯片盗用他人专利!最高或赔偿50亿美元
夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。 谷歌摊事了!摊上大事了! 据 Theregister 报道,Singular Computing公司的计算机科学家 Joseph Bates 近...
杀疯了的开源专家模型 Mixtral 8x7B 论文公开啦!
夕小瑶科技说 原创作者 | 付奶茶、王二狗上个月法国初创公司 Mistral AI 开源的一个8x7B MoE模型Mixtral 8x7B引爆了AI社区。 一是因为它的性能击败了LLama2和...
Arxiv最热论文推荐:揭秘Transformer新身份、谷歌VLM蒸馏、复旦LEGO模型
本文内容由 赛博马良「AI论文解读达人」 智能体生成,人工整理排版。 「AI论文解读达人」 可提供最热AI论文推荐、论文解读等功能。 传送门: https://www.sai...
百川智能发布角色大模型,零代码复刻角色
作者| 褚杏娟 2024 年 1 月 9 日,百川智能发布角色大模型 Baichuan-NPC,深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合...
大模型伪装「潜伏特工」学会!OpenAI劲敌重磅研究震惊马斯克
新智元报道编辑:编辑部 【新智元导读】最近,Anthropic的研究者发现:一旦我们教会LLM学会骗人,就很难纠正它了。它会在训练过程中表现得「人畜无害」,随后...