标签:指标

给RAG系统做一次全面「体检」,亚马逊开源RAGChecker诊断工具

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Cell | 细胞衰老实验的全新标准:体内研究的必要信息指南生物探索 2024年08月17日 15:25 江苏

来源:生物探索 引言Hayflick和Moorhead首次发表的细胞衰老研究将其定义为人成纤维细胞的极限增殖能力【1】。自此之后,研究人员通过细胞培养系统在衰老诱导...
阅读原文

12个必须了解的AI模型评估指标

来源:海豚数智科学实验室 构建机器学习模型或深度学习模型的想法遵循建设性反馈原则。你构建一个模型,从指标中获取反馈,进行改进,并继续下去,直到达到理...
阅读原文

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十

新智元报道编辑:桃子 好困 【新智元导读】一年一度谷歌学术指标公布了!Nature年年霸榜,而今年与以往不同的是,国际学术顶会的排名大幅提升,CVPR位居第二...
阅读原文

CVPR成全球第二大学术出版物,超越Science!AI顶会占领前20|谷歌学术指标2024

西风 发自 凹非寺量子位 | 公众号 QbitAI2024谷歌学术指标(Google Scholar Metrics)出炉,AI顶会掀起狂欢—— CVPR成为第二大学术出版物,超越Science,仅次...
阅读原文

AI 应用如何赚钱?全球 AI-Native 公司定价策略解密

人工智能(AI)应用正以惊人的速度改变着我们的生活和工作方式,从提高生产力到创造全新的工作成果,AI 应用的潜力无限。 然而,随着 AI 应用市场竞争日趋激...
阅读原文

谷歌发布 HEAL 架构,4 步评估医学 AI 工具是否公平

作者:加零 编辑:李宝珠,三羊 面向健康公平问题,Google 团队开发了 HEAL (The health equity framework) 框架,能够定量评估基于机器学习的医疗健康方案是...
阅读原文

清华、智谱AI团队:Loss才是涌现的关键,而非模型参数|论文分享

来源:GLM大模型 作者:GLM技术团队 大语言模型中的涌现能力(Emergent Ability)研究指出,伴随着模型参数的增大会出现能力涌现。但过去的观察却发现:1)小...
阅读原文

公开出售GitHub star、Kaggle点赞,「黑市」越来越明目张胆了吗?

选自wired作者:Kari McMahon机器之心编译编辑:杜伟Star 量可以真真假假,但别人用不用、用得好不好最终还是要看项目本身的含金量。在开发者的世界中,判断...
阅读原文

全都不及格!斯坦福100页论文给大模型透明度排名,GPT-4仅排第三

金磊 发自 凹非寺量子位 | 公众号 QbitAI试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用它们的相关信息。)...
阅读原文