标签:大模型训练
WPS接入DeepSeek,秒变办公神器!
WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍
原标题:代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍 文章来源:人工智能学家 内容字数:9145字AI寒武纪月之暗面团队:Muon 优化器与 Moonl...
DeepSeek发布NSA:超快速长上下文训练与推理的新突破
原标题:DeepSeek发布NSA:超快速长上下文训练与推理的新突破 文章来源:小夏聊AIGC 内容字数:3860字DeepSeek's NSA: A Breakthrough in Accelerating AI Mo...
厦门大学《大模型概念、技术与应用实践》(PPT文件)
《大模型概念、技术与应用实践》由厦门大学大数据教学团队制作,科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史...
张俊林从Deepseek R1看Scaling Law的未来
原标题:张俊林从Deepseek R1看Scaling Law的未来 文章来源:人工智能学家 内容字数:16988字大模型Scaling Law与S型智能增长曲线:一个思想实验 本文探讨了...