我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

最近真是 AI 圈的大年三十初一初二初啊。。。。。各个大厂都争先恐后的整花活!OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~谷...
阅读原文

Windsurf再更新,心心念的系统提示词来了,还有个神(?)级功能!

加我进AI讨论学习群,公众号右下角“联系方式”\x0d\x0a\x0d\x0a关注发送“ 知识精华 ”,可获得免费的知识链接地址
阅读原文

SynCamMaster:多视角视频生成模型引领视频创作新纪元

SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开...
阅读原文

苹果推出的视频生成大模型

STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本到视频(T2V)和文本图像到...
阅读原文

AI 漫画生成框架,能生成可控的黑白漫画面板

DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架,能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生成器和多...
阅读原文

小米孟二利揭示未来出行:三大关键任务助力AI定义汽车新时代!

数字化基建、产业协同、对适合工业场景的大模型技术的探索。
阅读原文

国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互

未来游戏创作的唯一限制只是创作者们的想象力
阅读原文

Maya:全球领先的智能家居助手提升生活便利性与安全性

Maya是开源的多语言多模态模型,基于指令微调扩展模型在多种语言和文化背景下的能力。Maya基于LLaVA框架,包含新创建的包含八种语言的预训练数据集,提高视觉...
阅读原文

Particle News:个性化视角下的AI新闻阅读平台,全面满足您的信息需求

Particle News是AI驱动的新闻阅读平台,基于汇总用户关心的话题,提供简洁的新闻摘要和多角度报道,帮助用户快速理解重要信息。用户能关注特定人物、地点或事...
阅读原文

巨人网络推出的有声游戏生成大模型

千影 QianYing是巨人网络推出的有声游戏生成大模型,包含游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame面向开放世界游戏,是巨人网络AI La...
阅读原文

谷歌推出的多模态 AI 虚拟助手

Project Astra 是谷歌 DeepMind 推出的多模态虚拟助手。能在用户的手机上和基于原型眼镜提供辅助,让用户用所未有的方式探索世界。Astra 支持自然交互,包括...
阅读原文

轻量级LLM应用开发框架,通过一行代码切换不同LLM

Promptic是轻量级的LLM应用开发框架,提供高效且符合Python风格的开发方式。基于LiteLLM,Promptic支持开发者能轻松切换不同的LLM服务提供商,只需更改一行代...
阅读原文

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

该研究为赋予多模态语言模型更强的推理能力铺平了道路。
阅读原文