标签:向量
「连续数值分布式表征」加持,浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight
新智元报道编辑:LRST 【新智元导读】来自浙江大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了他们关于「表格语言模型」(Tabular Language Model)的研究...
候选CVPR 2024最佳论文!深圳大学联手香港理工发布MemSAM:将 「分割一切」模型用于医学视频分割
作者:梅菜 编辑:李宝珠,三羊 深圳大学计算机与软件学院和香港理工大学智能健康研究中心联合提出了一种新颖的超声心动图视频分割模型 MemSAM,与现有模型相...
拿下SOTA!最强中文Embedding模型对标OpenAI,技术路线公开
新智元报道编辑:编辑部 【新智元导读】国产大模型「日日新 5.0」已经在权威主流评测中鲨疯了。变强的背后原因竟是,来自商汤自研中文Embedding模型——Piccolo...
轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
深度学习之父 Hinton 万字访谈录:中美 AI 竞赛没有退路可言(GPT-4o总结版)
视频链接:https://www.youtube.com/watch?v=tP-4njhyGvo&t=660s 访谈介绍:Joel Hellermark 与 AI 教父 Geoffery Hinton 的深度对话Geoffery Hinton 近...
浅谈RAG的十大挑战
直播预告 | 6月6日晚7点,「智猩猩AI新青年讲座」第238讲正式开讲,香港大学CVMI Lab在读博士杨霁晗将直播讲解《V-IRL:根植于真实世界的AI Agents》,欢迎扫...
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
机器之心报道 机器之心编辑部即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。最近两天,马斯克和 LeCun 的口水战妥妥成为大家的看...
基础架构竞争激烈,LSTM原作者提出指数门控xLSTM,性能直逼Transformer和Mamba
大数据文摘授权转载自将门创投 作者:seven_ 经典长短时记忆网络(LSTM)架构最早可以追溯到20世纪90年代,因其独特的常量误差传递(constant error carousel...
Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴
机器之心报道 机器之心编辑部「这份访谈的每一秒都是精华。」最近,图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。 视频链接:https://...
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞
新智元报道编辑:乔杨 好困 【新智元导读】Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注...
从零复现Llama3代码库爆火,大神Kapathy一键三连,GitHub狂揽2k+
西风 发自 凹非寺量子位 | 公众号 QbitAI让大神Andrej Karpathy一键三连❤️(点赞+转发+评论),一个教你从头开始实现Llama3的代码库爆火。 X上转赞收藏量超6....
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
机器之心报道 编辑:杜伟、陈萍项目中代码很多很全,值得细读。一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并...
大模型研究获最佳论文,WWW 2024奖项出炉
机器之心报道 编辑:陈萍本次公布的获奖论文中,有多位华人作者。The Web Conference(前身为 International World Wide Web Conference,WWW)会议是万维网...
识别细胞也能用大模型了!清华系团队出品,已入选ICML 2024 | 开源
水木分子 投稿量子位 | 公众号 QbitAI大模型带来的生命科学领域突破,刚刚再传新进展。 来自清华系,使用大模型实现了单细胞身份识别,同时模型LangCell也正...
沉浸式线性代数教材,不懂哪里点哪里,网友:天花板级别
克雷西 发自 凹非寺量子位 | 公众号 QbitAI线性代数太抽象学不懂?没关系,三名来自瑞典的学者,为我们带来了沉浸式的教程。 从向量到矩阵、从概念到运算,几...