标签:大型语言模型

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

MiniMax M2

MiniMax M2是MiniMax推出的专为编程和Agent工作流优化的大语言模型。模型拥有100亿激活参数和2300亿总参数,支持204,800的上下文窗口和131,072的最大输出Toke...
阅读原文

KAT-Dev-72B-Exp

KAT-Dev-72B-Exp 是快手推出的开源编程专用大语言模型,参数规模达720亿。模型是 KAT-Coder 的强化学习版本,专为软件工程任务设计。
阅读原文

Jamba Reasoning 3B

Jamba Reasoning 3B 是 AI21 Labs 推出的轻量级高效推理模型,拥有 30 亿参数和 256K 的超长上下文处理能力。模型用混合 Transformer-Mamba 架构,结合注意力...
阅读原文

Hunyuan-MT-7B

Hunyuan-MT-7B 是腾讯混元团队发布的轻量级翻译模型,参数量仅 70 亿,支持 33 个语种及 5 种民汉语言/方言互译。在国际计算语言学协会(ACL)WMT2025 比赛中...
阅读原文

《哪吒2》登顶全球动画电影票房榜/DeepSeek 发布新论文,梁文峰署名/OpenAI 前 CTO 官宣新公司

· 本田向日产提出恢复合并谈判条件\x0a· 腾讯紧急调用元宝支持微信搜索\x0a· 百度发布 2024 全年财报
阅读原文

DeepSeek R1爆火后,该如何理解 LLM 中的强化学习算法?

讨论下我们到底该如何理解 LLM 中所涉及到的 RL 算法。
阅读原文

长文本“新王”诞生!400万字输入,MiniMax首次开源即王炸

原标题:长文本“新王”诞生!400万字输入,MiniMax首次开源即王炸 文章来源:夕小瑶科技说 内容字数:5550字MiniMax-01:中国大模型的惊喜之作 本文总结了Min...
阅读原文

奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有……

原标题:奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有…… 文章来源:人工智能学家 内容字数:9043字OpenAI 2025新年目标及AGI展望 2024...
阅读原文

大型语言模型:超越人类专家的神经科学预测新纪元

原标题:Nature:大型语言模型在预测神经科学结果方面超越人类专家 文章来源:人工智能学家 内容字数:8465字大型语言模型在神经科学研究中的应用 根据一项新...
阅读原文

“智慧交融:大型语言模型与知识图谱的协同创新之路”

原标题:大型语言模型与知识图谱协同研究综述:两大技术优势互补 文章来源:人工智能学家 内容字数:19072字综述:LLM与知识图谱的联合研究进展 本综述文章...
阅读原文