标签：难度

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

最强 OpenAI o1 逻辑推理正确率仅 50%！清华、智谱推出「大模型逻辑推理新基准」

9.11 和 9.9 哪个大？这一连人类幼儿园儿童都能回答的问题，曾经（至今）难倒了众多大语言模型（LLM）。然而，要想达到通用人工智能（AGI）的水平，LLM 不仅...

阅读原文

AIGC动态

2年前 (2024)

00后国人论文登Nature，大模型对人类可靠性降低

一水发自凹非寺量子位 | 公众号 QbitAI00后国人一作登上Nature，这篇大模型论文引起热议。简单来说，论文发现：更大且更遵循指令的大模型也变得更不可靠了...

阅读原文

AIGC动态

2年前 (2024)

颠覆认知：大模型不可靠，越大越不可靠？最新研究登上 Nature

人工智能（AI）模型的参数规模越大，生成的答案就越准确？就更加可信？还真不一定！日前，一项发表在权威科学期刊 Nature 上的研究表明：相比于小参数模型...

阅读原文

AIGC动态

2年前 (2024)

北大AI奥数评测，o1-mini比o1-preview分数还高

Omni-MATH团队投稿量子位 | 公众号 QbitAIOpenAI的o1系列一发布，传统数学评测基准都显得不够用了。 MATH-500，满血版o1模型直接拿下94.8分。更难的奥数邀...

阅读原文

AIGC动态

2年前 (2024)

有了ChatGPT，还需要人类程序猿编码吗？

6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限...

阅读原文

AIGC动态

2年前 (2024)

ChatGPT无法取代人类程序员！ IEEE 35页论文测出困难编码正确率仅为0.66%

新智元报道编辑：编辑部【新智元导读】6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LL...

阅读原文

AIGC动态

2年前 (2024)

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

今日Arxiv最热NLP大模型论文：AllenAI最新研究：让AI从简单学起，竟然能解决难题？

夕小瑶科技说原创作者 | 赛博马良本期论文解读非人类撰写，全文由赛博马良「AI论文解读达人」智能体自主完成，经人工审核后发布。智能体传送门： https:/...

阅读原文

AIGC动态

2年前 (2024)