标签:图像
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
机器之心发布 机器之心编辑部字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程...
ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star
机器之心报道 编辑:陈陈、小舟同样是图生视频,PaintsUndo 走出了不一样的路线。ControlNet 作者 Lvmin Zhang 又开始整活了!这次瞄准绘画领域。 新项目 Pai...
多模态模型(VLM)部署方法抛砖引玉
7月11日19点,「智猩猩自动驾驶新青年讲座」第36讲将开讲,主讲理想汽车最新成果:基于MLLM的闭环规划智能体PlanAgent,由理想汽车实习研究员、中国科学院自...
超过 GPT-4V!哈佛医学院 AI 机器人登上 Nature,肿瘤识别率接近 90%
大数据文摘受权转载自学术头条 撰文:田小婷 当前,癌症已经成为全球人口死亡的主要原因之一,每年有数百万人死于癌症。世界卫生组织曾提出,三分之一的癌症...
Meta新研究挑战CV领域基操:ViT根本不用patch,用像素做token效果更佳
新智元报道编辑:乔杨 【新智元导读】下一代视觉模型会摒弃patch吗?Meta AI最近发表的一篇论文就质疑了视觉模型中局部关系的必要性。他们提出了PiT架构,让T...
上交&阿里:掀开多模态大模型的头盖骨,解密黑盒模型推理过程
夕小瑶科技说 原创作者 | 谢年年多模态大模型的发展势头正猛,研究者们热衷于通过微调模型,打造出具有更高输入分辨率、更复杂功能、更强感知能力以及更精细...
更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅
机器之心原创 作者:杜伟一转眼,2024 年已经过半。我们不难发现,AI 尤其是 AIGC 领域出现一个越来越明显的趋势:文生图赛道进入到了稳步推进、加速商业落地...
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
新智元报道编辑:编辑部 【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自...
「吗喽」在想啥?AI读心术精准重建猕猴大脑图像,网友:我们成三体人了
新智元报道编辑:耳朵 Aeneas 【新智元导读】荷兰拉德布德大学的研究团队通过定位大脑注意力机制,在AI「读心术」领域精确生成图像,能够依据大脑活动记录极...
AI发展方向——从pipeline到end2end
荷楼~~,大家好,我是 JioNLP。 这些天我在做图像目标检测与跟踪。 我越做越感觉,这块 AI 任务的建模方式和处理方式存在很多的问题。 我先分开说说目标检测...
今天,阶跃星辰正式发布万亿MoE大模型|甲子光年
国产大模型跑出了“阶跃速度”。作者|赵健 今年的世界人工智能大会(WAIC),“大模型”含量极高,既有已发布模型的集中展示,也有大模型的首发亮相。 其中,阶...
阶跃星辰首发「万亿」和「多模」大模型,还与《大闹天宫》跨界联动 | WAIC 2024
阶跃星辰 再出王炸仅仅过去 100 天左右,站在 AGI 风口上的阶跃星辰再次亮出王炸成果。 在今天揭幕的世界人工智能大会,阶跃星辰宣布对 Step 系列通用大模型...
全员i人?《大闹天宫》MBTI测试让全公司炸锅!最神秘国产大模型团队出手了
新智元报道编辑:编辑部 【新智元导读】最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景...
Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放
LlamaGen团队 投稿量子位 | 公众号 QbitAI只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。 来自港大和字节的研究人员,提出了基于自...
文字秒变立体图像!Meta推出强大的3D生成模型
点击上方蓝字关注我们“Meta公司推出的3D Gen模型,能在60秒内将文字转化为立体图像,预示着创意产业的一次重大突破。Meta公司在人工智能领域取得了突破性进展...