标签：图像

GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

机器之心发布机器之心编辑部字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程...

阅读原文

AIGC动态

2年前 (2024)

ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

机器之心报道编辑：陈陈、小舟同样是图生视频，PaintsUndo 走出了不一样的路线。ControlNet 作者 Lvmin Zhang 又开始整活了！这次瞄准绘画领域。新项目 Pai...

阅读原文

AIGC动态

2年前 (2024)

多模态模型(VLM)部署方法抛砖引玉

7月11日19点，「智猩猩自动驾驶新青年讲座」第36讲将开讲，主讲理想汽车最新成果：基于MLLM的闭环规划智能体PlanAgent，由理想汽车实习研究员、中国科学院自...

阅读原文

AIGC动态

2年前 (2024)

超过 GPT-4V！哈佛医学院 AI 机器人登上 Nature，肿瘤识别率接近 90%

大数据文摘受权转载自学术头条撰文：田小婷当前，癌症已经成为全球人口死亡的主要原因之一，每年有数百万人死于癌症。世界卫生组织曾提出，三分之一的癌症...

阅读原文

AIGC动态

2年前 (2024)

Meta新研究挑战CV领域基操：ViT根本不用patch，用像素做token效果更佳

新智元报道编辑：乔杨【新智元导读】下一代视觉模型会摒弃patch吗？Meta AI最近发表的一篇论文就质疑了视觉模型中局部关系的必要性。他们提出了PiT架构，让T...

阅读原文

AIGC动态

2年前 (2024)

上交&阿里：掀开多模态大模型的头盖骨，解密黑盒模型推理过程

夕小瑶科技说原创作者 | 谢年年多模态大模型的发展势头正猛，研究者们热衷于通过微调模型，打造出具有更高输入分辨率、更复杂功能、更强感知能力以及更精细...

阅读原文

AIGC动态

2年前 (2024)

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

机器之心原创作者：杜伟一转眼，2024 年已经过半。我们不难发现，AI 尤其是 AIGC 领域出现一个越来越明显的趋势：文生图赛道进入到了稳步推进、加速商业落地...

阅读原文

AIGC动态

2年前 (2024)

国产动漫视频AI火了！二次元老婆随意捏，哥特、梦幻、机甲一键get

新智元报道编辑：编辑部【新智元导读】视频生成赛道又起新秀，而且还是二次元定制版！稳定产出电影级画面，一键文/图生成视频，即使是「手残党」也能复刻自...

阅读原文

AIGC动态

2年前 (2024)

「吗喽」在想啥？AI读心术精准重建猕猴大脑图像，网友：我们成三体人了

新智元报道编辑：耳朵 Aeneas 【新智元导读】荷兰拉德布德大学的研究团队通过定位大脑注意力机制，在AI「读心术」领域精确生成图像，能够依据大脑活动记录极...

阅读原文

AIGC动态

2年前 (2024)

AI发展方向——从pipeline到end2end

荷楼~~，大家好，我是 JioNLP。这些天我在做图像目标检测与跟踪。我越做越感觉，这块 AI 任务的建模方式和处理方式存在很多的问题。我先分开说说目标检测...

阅读原文

AIGC动态

2年前 (2024)

今天，阶跃星辰正式发布万亿MoE大模型｜甲子光年

国产大模型跑出了“阶跃速度”。作者｜赵健今年的世界人工智能大会（WAIC），“大模型”含量极高，既有已发布模型的集中展示，也有大模型的首发亮相。其中，阶...

阅读原文

AIGC动态

2年前 (2024)

阶跃星辰首发「万亿」和「多模」大模型，还与《大闹天宫》跨界联动 | WAIC 2024

阶跃星辰再出王炸仅仅过去 100 天左右，站在 AGI 风口上的阶跃星辰再次亮出王炸成果。在今天揭幕的世界人工智能大会，阶跃星辰宣布对 Step 系列通用大模型...

阅读原文

AIGC动态

2年前 (2024)

全员i人？《大闹天宫》MBTI测试让全公司炸锅！最神秘国产大模型团队出手了

新智元报道编辑：编辑部【新智元导读】最近，公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试！各种直击打工人的灵魂拷问，让所有i人和e人在职场极限场景...

阅读原文

AIGC动态

2年前 (2024)

Llama也能做图像生成！港大字节推出开源自回归文生图模型，在线体验已开放

LlamaGen团队投稿量子位 | 公众号 QbitAI只需Image Tokenizer，Llama也能做图像生成了，而且效果超过了扩散模型。来自港大和字节的研究人员，提出了基于自...

阅读原文

AIGC动态

2年前 (2024)

文字秒变立体图像！Meta推出强大的3D生成模型

点击上方蓝字关注我们“Meta公司推出的3D Gen模型，能在60秒内将文字转化为立体图像，预示着创意产业的一次重大突破。Meta公司在人工智能领域取得了突破性进展...

阅读原文

AIGC动态

2年前 (2024)

1…10 111213 14…48