Wavy

Wavy是AI驱动的照片编辑应用,基于先进的AI技术,将用户的照片转换成具有艺术感的杰作。Wavy主要功能包括AI艺术生成器、视觉放大、即时艺术创作、照片提升和...
阅读原文

什么是人脸识别(Face recognition)

人脸识别(Face recognition)是一种基于人的面部特征进行身份识别的技术。通过计算机视觉和模式识别技术,对输入的人脸图像或视频流进行分析,首先判断是否...
阅读原文

WIME

WIME是上海微盟企业发展有限公司推出的AI电商内容创作平台,专为电商和新媒体领域设计。基于AI技术,帮助用户一键生成多风格图片和文案,实现从创意到成品的...
阅读原文

最新 | 福布斯发布2025年AI十大趋势!

原标题:最新 | 福布斯发布2025年AI十大趋势! 文章来源:人工智能学家 内容字数:9942字2025年人工智能十大趋势:机遇与挑战并存 本文总结了美国《福布斯》...
阅读原文

科学没有衰落,谷歌 AI 推动科学发展的 9 种方式

原标题:科学没有衰落,谷歌 AI 推动科学发展的 9 种方式 文章来源:人工智能学家 内容字数:12849字谷歌AI for Science:九大突破与未来展望 近年来,科学...
阅读原文

Claude CEO的最新万字长文,比山姆奥特曼更理性实际!

值得每一个关注AI的人读一读!AI如何更好的改变世界!
阅读原文

如何基于 OpenRLHF 定制内部 RFT 训练框架

在这里做一个简单的code walkthroug,以release的0.5.3版本为基准。
阅读原文

OpenAI真的开源了!这波「嵌入式实时语音」操作,让万物开口说话,我爱了

原标题:OpenAI真的开源了!这波「嵌入式实时语音」操作,让万物开口说话,我爱了 文章来源:夕小瑶科技说 内容字数:3712字OpenAI开源嵌入式实时语音SDK:让...
阅读原文

Agent操纵手机/电脑屏幕的全面综述

原标题:Agent操纵手机/电脑屏幕的全面综述 文章来源:夕小瑶科技说 内容字数:8428字LLM-Brained GUI Agents: 革命性的交互方式 随着LLM和Agent技术的飞速...
阅读原文

Meta 要给爆款智能眼镜装上显示屏,最快明年发布

Ray-Ban 智能眼镜离 AR 硬件又近了一步。
阅读原文

AgentScope:阿里开源多智能体开发平台实现高效协作与智能决策

AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API...
阅读原文

VisionFM:少样本多疾病诊断的智能眼科AI模型

VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、...
阅读原文
178910111,260