震撼!英伟达RTX 50系列旗舰5090显存高达32GB,游戏体验再升华!

下月的 CES 2025 大会,英伟达依然是关注的焦点。
阅读原文

解码情感:新一代多模态模型超越指令,洞察隐含情绪

造出指令遵循能力卓越的多模态语言模型。
阅读原文

颠覆视觉认知:Florence-VL引领多模态大语言模型的新纪元

通过融合不同深度的特征,Florence-VL实现了更全面的视觉理解。
阅读原文

突破视觉边界:北航与VAST联手推出MV-Adapter,轻松生成多视角图像

面向通用多视图生成的第一个适配器解决方案。
阅读原文

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

通过融合不同深度的特征,Florence-VL实现了更全面的视觉理解。
阅读原文

英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

下月的 CES 2025 大会,英伟达依然是关注的焦点。
阅读原文

开源漫画图片文字翻译工具,多语言翻译无缝嵌入原图

Manga Image Translator是开源的漫画图片文字翻译工具,能一键翻译漫画和图片中的文字。Manga Image Translator基于OCR技术识别文本,结合机器翻译将文字转换...
阅读原文

AI试卷识别处理软件,具备高清扫描、手写擦除、试卷还原等功能

拍试卷是为学生和教师设计的试卷扫描和处理软件。拍试卷基于OCR(光学字符识别)技术,从图片中提取文字变得快速和准确,保持原有的排版格式。拍试卷具备高清...
阅读原文

AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型

Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型,专为移动端和边缘设备设计。模型拥有3B参数量,相较于其他多模态大模型,显...
阅读原文

清华和腾讯共同推出的图像序列着色模型

ColorFlow是清华大学和腾讯ARC实验室共同推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色。基于检索增强、上下文学习和超分辨率技...
阅读原文

集成多种社交媒体和通讯渠道的 AI 自动化客户管理工具

Superchat是企业级全渠道消息服务平台,帮助企业整合WhatsApp、Instagram、Facebook Messenger 等渠道建立忠实的客户关系、自动化发送新闻通讯、销售产品并回...
阅读原文

AI全栈开发平台,自然对话快速构建网站和Web应用

Lovable 是AI全栈工程师工具,基于自然语言处理技术,让用户能用对话快速构建网站和Web应用程序。Lovable 平台支持与Supabase集成,实现数据库连接和用户认证...
阅读原文