具身元年压轴,智源线虫登Nature子刊封面!具身智能迎新纪元
原标题:具身元年压轴,智源线虫登Nature子刊封面!具身智能迎新纪元 文章来源:新智元 内容字数:9255字智源研究院BAAIWorm天宝:登上Nature子刊封面的线虫...
Granite 3.1
Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型...
Sketch2Sound
Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术,能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度和音高三个...
OmniAudio-2.6B
OmniAudio-2.6B是Nexa AI推出的音频语言模型,专为边缘部署设计,能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多模态模型融合Gemma-2-2...
苹果无边框 iPhone 被曝要推迟,但「无边泳池」不远了
原标题:苹果无边框 iPhone 被曝要推迟,但「无边泳池」不远了 文章来源:爱范儿 内容字数:6230字苹果与无边框iPhone的追逐:技术与设计的博弈 本文探讨了...
DisPose:提升动画质量的智能人物图像控制技术
DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的,提高人物图像动画质量的控制技术,基于从骨骼姿态和参考图像中提取有效...