标签:大模型训练

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍

原标题:代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍 文章来源:人工智能学家 内容字数:9145字AI寒武纪月之暗面团队:Muon 优化器与 Moonl...
阅读原文

DeepSeek发布NSA:超快速长上下文训练与推理的新突破

原标题:DeepSeek发布NSA:超快速长上下文训练与推理的新突破 文章来源:小夏聊AIGC 内容字数:3860字DeepSeek's NSA: A Breakthrough in Accelerating AI Mo...
阅读原文

厦门大学《大模型概念、技术与应用实践》(PPT文件)

《大模型概念、技术与应用实践》由厦门大学大数据教学团队制作,科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史...
阅读原文

张俊林从Deepseek R1看Scaling Law的未来

原标题:张俊林从Deepseek R1看Scaling Law的未来 文章来源:人工智能学家 内容字数:16988字大模型Scaling Law与S型智能增长曲线:一个思想实验 本文探讨了...
阅读原文

万卡时代,一家IT企业的智算 |甲子光年

通过硬件和软件的双重布局,蓝耘呈现了一个经过时间检验的答案。
阅读原文