标签:数据

大模型总结摘要靠谱吗?比人类写的流畅,用GPT-4幻觉还少

机器之心报道编辑:陈萍以后文本摘要总结任务,可以放心交给大模型了。文本摘要,作为自然语言生成(NLG)中的一项任务,主要用来将一大段长文本压缩为简短的...
阅读原文

哈佛、哥大开源1600万组蛋白质序列,解决AlphaFold 2训练数据私有难题!

新智元报道编辑:Aeneas【新智元导读】这个叫OpenProteinSet的开源数据集,提供1600万个开源蛋白质多序列对齐(MSA)和相关数据。它涵盖了所有蛋白质数据库的...
阅读原文

AI每日要闻:9月18日

图|匡萃彪文|匡萃彪OpenAI急于超越谷歌,推出“多模态”LLM谷歌即将发布Gemini人工智能,与OpenAI展开竞争。这是下一代大型语言模型,具备多模态能力,不仅能...
阅读原文

天猫精灵更名并接入大模型;火山引擎数智平台发布AI助手;传智谱AI获腾讯阿里新融资丨AIGC大事日报

09/19全球AIGC产业要闻1、传OpenAI计划推出多模态大模型Gobi2、谷歌AI聊天机器人Bard提供插件支持3、腾讯云联合信通院发布金融行业大模型标准4、阿里通义行业...
阅读原文

用大模型,火山引擎要把数据飞轮「转」起来

机器之心报道作者:姜菁玲在大模型对千行百业的改造进程中,火山引擎率先交出了一份数据行业的个性化答案。9 月 19 日,在上海举办的 “数据飞轮・V-Tech 数据...
阅读原文

超38TB私人文件泄露,微软员工的聊天记录都被看到了

机器之心报道编辑:梓文微软员工的聊天记录都被看到了推特上突然出现的一则消息引发了大家的关注。博客链接:https://www.wiz.io/blog/38-terabytes-of-priva...
阅读原文

9.19丨AIGC大事日报

09/19全球AIGC产业要闻1、传OpenAI计划推出多模态大模型Gobi2、谷歌AI聊天机器人Bard提供插件支持3、腾讯云联合信通院发布金融行业大模型标准4、阿里通义行业...
阅读原文

新多模态大模型霸榜!支持图文混合输入,不懂知识还能现学

克雷西 发自 凹非寺量子位 | 公众号 QbitAI多模态大模型家族,又有新成员了!不仅能将多张图像与文本结合分析,还能处理视频中的时空关系。这款免费开源的模...
阅读原文

谷歌云推出 AlloyDB AI:用先进的向量嵌入和 AI 改造 PostgreSQL

作者 | Steef-Jan Wiggers 译者 | 刘雅梦 策划 | Tina 在最近的 Google Cloud Next 中,谷歌在预告中宣布了 AlloyDB AI 是 AlloyDB for PostgreSQL 的一个组...
阅读原文

微软38 TB内部数据惨遭泄露!私人密钥、3w+工作对话流出,背后原因震惊了

新智元报道编辑:润 Lumina【新智元导读】昨天,微软在GitHub上发布开源训练数据时,无意中泄露了38 TB的内部数据。好在,百亿独角兽Wiz及时发现了漏洞,现在...
阅读原文

34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%

新智元报道编辑:LRS【新智元导读】数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,...
阅读原文

比GPT-4还强,20亿参数模型做算术题,准确率几乎100%

机器之心报道编辑:陈萍、小舟语言模型做数学题,能力又升级了。当前,大型语言模型 (LLM) 在处理 NLP 领域的各种下游任务方面已经表现出卓越的能力。特别是...
阅读原文

国产大模型推理能力已超GPT-3.5!冲进OpenAI评测榜第一梯队

唐璜 发自 凹非寺量子位 | 公众号 QbitAIOpenAI开源的数学数据集,中国厂商新成绩一举冲到最前列!就在9月16日,国产大模型在权威推理评测集GSM8K中,首次达...
阅读原文

AI「领悟」有理论解释了!谷歌:两种脑回路内部竞争,训练久了突然不再死记硬背

梦晨 发自 凹非寺量子位 | 公众号 QbitAI谷歌PAIR团队不久前撰文介绍了AI的“领悟”(Grokking)现象——训练久了突然不再死记硬背,而是学会举一反三,有了泛化...
阅读原文

CCF C³-24@中电金信:超级算力时代的新格局 | 开始报名

C³活动第24期主题:超级算力时代的新格局,将于2023年9月21日周四(16:30-19:30)在上海举行,报名从速。在深度数字化转型时代,随着算力需求增长和算力供给...
阅读原文