微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

代码全开源,支持用户在自定义数据集上微调
阅读原文

余承东:华为明年有大家想不到的产品/京东客服全员平均涨薪 2 个月/小米官宣与「蔚小理」合作,共享充电桩

· Sakana AI 推出全新算法,AI 首次自主发现人工生命\x0d\x0a· 智己汽车完成 94 亿元 B 轮融资\x0d\x0a· 如祺出行「全无人」Robotaxi 上线
阅读原文

五道送命题,彻底暴露了国内外AI们的情商…

原标题:五道送命题,彻底暴露了国内外AI们的情商... 文章来源:夕小瑶科技说 内容字数:2096字奶茶与AI的“情商”大考验:一场啼笑皆非的实验 本文记录了博主...
阅读原文

大模型微调(Fine-Tuning)全流程思考

冬令营优秀学习笔记(二)
阅读原文

颠覆GPT!Meta推出大型概念模型LCM: 从“猜词”到“理解”

LCM是一种完全不同的语言建模范式,它将推理与语言表征分离
阅读原文

什么是视觉语言模型(Vision-Language Models, VLMs)

视觉语言模型(Vision-Language Models, VLMs)是一种多模态人工智能系统,它结合了图像和文本的处理能力,以执行高级视觉语言任务,如视觉问答(Visual Ques...
阅读原文

Browser Use

Browser Use是专门为大语言模型服务的智能浏览器工具,创新的Python工具库,让AI代理能像人类一样自然地浏览和操作网页。Browser Use支持多标签页管理、视觉...
阅读原文

ChiChat

ChiChat是AI驱动的智能助手平台,提供个人知识库、语音处理和创意图像生成服务。ChiChat集成多个前沿模型,用户能用自然语言与智能系统互动。ChiChat支持o1和...
阅读原文