标签:场景
纯文本模型训出「视觉」表征!MIT最新研究:语言模型用代码就能作画
新智元报道编辑:LRS 【新智元导读】不用图像,只用文本就能训练出视觉概念表征?用写代码的方式读懂画面,形状、物体、场景都能懂!只会「看书」的大语言模...
垂直场景大有可为,电商AI图片工具PhotoRoom完成新融资,估值5亿美元
AI 图像编辑领域一直是热门领域,国内的妙鸭相机就是其中的代表产品,但 ToC 显然不是产品落地的唯一场景,更多垂直场景的落地才是 AI 图像编辑的发展方向。...
短视频界的变革者:上海 AI lab 发布 Vlogger,几句话生成分钟级视频
夕小瑶科技说 原创作者 | 智商掉了一地、Python 现如今,vlog 已经成为我们日常生活的重要组成部分。无论是看视频学习休闲、记录珍贵瞬间还是分享生活见闻,...
画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了
机器之心报道 编辑:陈萍现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托...
一年内完成4轮融资,这家深圳机器人公司做起了扫雪生意|甲子光年
「Yarbo汉阳科技」A轮总融资额达数千万美元。作者|赵健 「甲子光年」独家获悉,消费级智能庭院机器人公司「Yarbo汉阳科技」(下文简称Yarbo),近期完成近千...
张鹏、潘乱对谈白鸦、肖弘:大模型时代的产品经理,需要 Back to the Future
在 AI 应用的路线上,有赞和 Monica.im(简称 Monica)是两种截然不同的代表。 2012 年成立的有赞,是和微信一起成长起来的为商家服务的 ToB 平台,在 2023 年...
自动驾驶落地,如何做到技术与场景相匹配?|甲子光年
自动驾驶的开发将由目标场景来引导。作者|张麟 编辑|赵健 自从1885年卡尔·本茨发明汽车以来,这个人类历史上最重要的交通工具之一就开始朝着“自动化”不断...
对话联想中国区总裁刘军:全栈智能布局已有7年,联想不会做通用大模型
AI PC的落地、兴起、普及所撬动的不仅仅是PC产业里像联想这样核心玩家的业务,最终影响的是大众在使用PC作为生产力工具的全新使用体验和玩法,而这一改变才刚...
一部iPhone实时渲染300平房间,精度达厘米级别!谷歌最新研究证明NeRF没死
新智元报道编辑:桃子 【新智元导读】3D实时渲染又要进入新时代了!谷歌团队最新研究SMERF能够在手机、电脑上实时渲染大型3D场景。3D实时渲染大型场景,一台...
不仅做GPT Store,OpenAI还要搜索引擎|甲子光年
300万GPTs背后的超级流量入口。作者|赵健 在发布GPTs(ChatGPT的自定义版本)功能两个月之后,OpenAI终于在今天上线了万众期待的GPT Store。 OpenAI宣称用户...
AI 改造职场:“讨好"完老板,钉钉开始 “讨好打工人”了
从 2014 年发布后的很长一段时间里,钉钉几乎把企业管理做到了极致:打卡、“DING'一下……以至于很多上班族纷纷吐槽听不得钉钉提示音、“讨好老板”……终于,钉钉...
斯年智驾完成数亿元融资,自动驾驶行业迎来2024年|甲子光年
“只要人们信任自动驾驶,就会信任AI带来的一切革命。”作者|墨光 编辑|栗子 2024年,自动驾驶行业迎来开门红。 1月3日,场景物流无人驾驶公司“斯年智驾”宣...
大模型在金融领域找到“业技融合”的最佳路径了吗?
嘉宾 | 魏生、敬忠文、张少博编辑 | 赵钰莹 经过一年多的发酵讨论,业内对生成式 AI 的概念已有基本认知。但是,如何将生成式 AI 相关技术落地在业务场景,并...
李飞飞团队新作:AI透视眼,穿越障碍看清你,渲染遮挡人体有新突破了
机器之心报道 编辑:大盘鸡、小舟即使遮挡,也能渲染出高保真的 3D 人体。AR/VR 、电影和医疗等领域都在广泛地应用视频渲染人类形象。由于单目摄像头的视频获...
史上首次!人形机器人敲响上市锣,优必选苦熬11年闯关成功
新智元报道编辑:编辑部 【新智元导读】优必选上市,可以称之为人形机器人商业化进程的一个重要节点。大模型爆发的这一年,已经给人形机器人的发展按下的快进...