引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

DRT-o1 将长 CoT 的成功引入神经机器翻译。
阅读原文

DeepSeek V3

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表...
阅读原文

3DHM

3DHM(3D Human Motions)是先进的3D人体动作生成技术,加州大学伯克利分校的研究人员推出。能从单张人物照片生成具有3D控制的动态人体视频,实现从静态图像...
阅读原文

CMU等提出超实用「模型泛化性」指标,分布外准确率提升6% | ICML 2024 Oral

原标题:CMU等提出超实用「模型泛化性」指标,分布外准确率提升6% | ICML 2024 Oral 文章来源:新智元 内容字数:6404字深度学习模型泛化能力评估新方法:基...
阅读原文

Anthropic联创:Scaling Law没崩,但推理成天价!有了TTT,25年AI更加速

原标题:Anthropic联创:Scaling Law没崩,但推理成天价!有了TTT,25年AI更加速 文章来源:新智元 内容字数:5825字AI发展并未停滞:规模法则(Scaling Law...
阅读原文

「数字孪生」东京上线!Jim Fan:具身智能零样本迁移现实世界,共享「蜂群思维」

原标题:「数字孪生」东京上线!Jim Fan:具身智能零样本迁移现实世界,共享「蜂群思维」 文章来源:新智元 内容字数:6059字东京高精度数字孪生模型公开发布...
阅读原文

英特尔至强6独享MRDIMM,内存带宽飙升,加速推理达2.4倍!

在解决了「能或不能」的问题之后,推理成本是大语言模型落地最后最关键的挑战
阅读原文

陶哲轩:顶级数学家是如何炼成的?学习数学的痛点与突破全解读

原标题:陶哲轩:顶级数学家是如何炼成的?学习数学的痛点与突破全解读 文章来源:人工智能学家 内容字数:18137字陶哲轩谈数学学习:超越分数与技巧,走向深...
阅读原文

“为Perplexity付费已没有意义!”谷歌搜索反击,发布最有“谷歌风格”的AI应用!

随着Gemini家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。
阅读原文

大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造

原标题:大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造 文章来源:人工智能学家 内容字数:7929字利用大模型加速人工生命研究:ASAL范...
阅读原文

AI 驱动的智能化单元测试生成:字节跳动的实践与创新

在软件开发的生命周期中,自动生成单元测试成为提高代码质量和开发效率的关键技术。
阅读原文

爱思唯尔:洞察2024:科研人员对人工智能的态度报告

原标题:爱思唯尔:洞察2024:科研人员对人工智能的态度报告 文章来源:人工智能学家 内容字数:16861字欧米伽未来研究所:人工智能时代的人类演化 本文基于...
阅读原文

2025年,半导体行业三大技术热点

原标题:2025年,半导体行业三大技术热点 文章来源:人工智能学家 内容字数:10924字2025年半导体行业三大突破:人工智能驱动下的创新 随着人工智能应用的爆...
阅读原文

DRT-o1

DRT-o1是腾讯研究院推出的一系列AI模型,通过长链思考推理(CoT)技术显著提升了文学作品的翻译质量,尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解...
阅读原文

FastExcel

FastExcel是基于Java的开源库,提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel,提供性能优化、bug修复,新增如读取指定...
阅读原文