LLM2LLM

LLM2LLM是创新的迭代数据增强策略,旨在提升大型语言模型(LLM)在数据稀缺情况下的性能。方法通过基于一个强大的教师模型来生成合成数据,增强学生模型的训...
阅读原文

CodeElo

CodeElo 是用于评估大型语言模型(LLMs)在编程竞赛级别代码生成能力的基准测试工具。通过与人类程序员的 Elo 评级系统进行比较,来衡量 LLMs 的编程水平。工...
阅读原文

FlexRAG

FlexRAG 是创新的检索增强生成(RAG)框架,旨在解决传统 RAG 系统在处理长上下文时面临的计算成本高和生成质量不足的问题。通过将检索到的上下文信息压缩成...
阅读原文

GeneralDyG

GeneralDyG 是南洋理工大学研究团队提出的通用动态图异常检测方法,旨在解决动态图数据在社交网络、电商和网络安全等领域的异常检测问题。通过时间 ego-graph...
阅读原文

海豚AI配音

海豚AI配音是功能全面的AI配音工具,能将文本转换为逼真、富有情感的语音。海豚AI配音提供超500种真人音色和1000多种二次元音色,支持20多种语言,满足不同用...
阅读原文

J1 Assistant AI

J1 Assistant AI 是罗永浩旗下的 AI 初创项目 Jarvis 推出的聚合类 AI 助理软件。软件目前仅提供安卓版本,并且官网对国内 IP 进行了锁定。J1 Assistant AI ...
阅读原文

Weights

Weights 是AI创作平台,基于AI技术创作各种类型的多媒体内容。用户在平台上免费创建多种作品,包括语音翻唱、合唱、文字转语音、图片、视频、音乐,及与 AI ...
阅读原文

2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现

原标题:2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现 文章来源:人工智能学家 内容字数:15148字2025年AI发展趋势展望:迈向端侧、多...
阅读原文

深度|诺奖得主Hinton:人类当下局面是,旧石器时代的大脑、中世纪的制度与类神的技术

原标题:深度|诺奖得主Hinton:人类当下局面是,旧石器时代的大脑、中世纪的制度与类神的技术 文章来源:人工智能学家 内容字数:49949字人工智能的未来:机...
阅读原文

复旦大学51页的论文,从强化学习的角度分析实现o1的路线图

原标题:复旦大学51页的论文,从强化学习的角度分析实现o1的路线图 文章来源:人工智能学家 内容字数:13621字欧米伽未来研究所:解读复旦大学关于O1模型的突...
阅读原文

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库

原标题:斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库 文章来源:人工智能学家 内容字数:10392字斯坦福大学新研究...
阅读原文

简单聊聊Deepseek V3的FP8训练

deepseek对训练fp8量化的观察和解决方法都很有启发,希望能看到fp8训练继续大放异彩
阅读原文

机器人技术永远不会出现“ChatGPT时刻”

今年可能是通用机器人技术有史以来最激动人心的一年。
阅读原文