标签:模型
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
机器之心报道 编辑:杜伟、陈陈随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。上个月,谷歌宣布对旗...
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
机器之心发布 机器之心编辑部近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型...
整合长期记忆,AI实现自我进化,探索大模型这一可能性
机器之心报道 编辑:Panda、小舟地球上最早的生命证据至少可以追溯到 35 亿年前,而直到大约 25 万到 40 万年前,智人才出现地球上。在这漫长的岁月中,生物...
NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
多模态大模型: 盘点&Highlights part1——从BLIP到LLaVA
讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读Hi大家好,我叫延捷,...
微软CEO薪酬暴涨63%至7910万美元;文远知行纳斯达克正式上市,大涨触发两次熔断;商汤回应多业务线裁员|AI周报
整理 | 傅宇琪、褚杏娟 组织架构调整:商汤回应战略,招聘正常进行;腾讯公关总监回应网传 2 万多名员工将搬迁;拼多多周年庆为员工发黄金;华为正式发布原生...
OpenAI语音转录工具被曝严重幻觉:转录100小时,一半儿在瞎扯
西风 发自 凹非寺量子位 | 公众号 QbitAIOpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重—— 100多小时转录,被工程师发现约一半都在...
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
新智元报道编辑:桃子 LRS 【新智元导读】科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis...
NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
多模态 AI 之所以能成为趋势,是因为其触达了人类智能的本质。作者丨朱可轩 编辑丨陈彩娴 今年到 CNCC 现场参会的朋友,想必都对 CNCC 2024 举办所在地——超过...
独家丨字节招兵买马,拟在欧洲设立AI研发中心
新一轮的全球AI人才招揽正式开始。作者丨房晓楠 编辑丨马晓宁 AI 科技评论独家获悉,字节跳动准备在欧洲设立 AI 研发中心。 知情人士透露,字节跳动目前已经...
太古可口可乐:将经验转化为数据,探索行业专有模型
出品|InfoQ·《行知数字中国》 嘉宾|冯柯,太古可口可乐中国区数字与资讯科技总经理 主持|霍太稳,极客邦科技创始人兼 CEO 编辑|罗燕珊既然可口可乐的配方...
百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景
作者 | 华卫 近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全...
LLM等价于众包,只是在输出「网络」!哈佛大学最新报告深挖大模型幻觉!
夕小瑶科技说 分享来源 | 新智元自ChatGPT发布以来,用户的搜索方式、人机交互都发生了极大改变,诸如问题回答、文本总结和交流对话等各种简单应用场景下的体...