学而思研发面向全球数学爱好者大模型MathGPT

ChatGPT新手指南 3年前 (2023) MM

1,908 0 0

【导读】近日，学而思官宣称，正在自研的数学大模型「MathGPT」，目前已取得阶段性成果。

近日，在各家大厂打得如火如荼的「ChatGPT大战」中，学而思也加入其中。

不过，学而思另辟蹊径选择的是自研数学大模型「MathGPT」，以数学领域的解题和讲题算法为核心，并且已经取得了阶段性成果。

对此学而思表示，基于该自研大模型的产品级应用预计会在年内推出，将面向全球数学爱好者和科研机构。

作为公司的核心项目，学而思早在今年春节之前就启动了相应的团队建设、数据、算力准备和技术研发，并直接交由CTO田密负责。

此外，位于美国硅谷的团队建设目前也已经启动，计划成立一支海外算法和工程团队，在全球范围内招募优秀的人工智能专家加入。

MathGPT与大语言模型（LLM）的差异

今年三月，OpenAI正式发布大语言模型GPT-4。随后，国内百度、阿里也推出了各自的大模型产品。

然而，通用语言模型更像一个「文科生」，在语言翻译、摘要、理解和生成等任务上有出色表现，但在数学问题的解决、讲解、问答和推荐方面则存在明显不足——

「解答数学问题经常出错，有些数学问题虽然能够解决，但方法更偏成年人，无法针对适龄孩子的知识结构和认知水平做适配。」

对此，学而思AI团队负责人表示，这种不足是由LLM模型的自身特点决定的。LLM大模型来自对海量语言文本的训练，因此最擅长语言处理。

行业内偏向基于LLM大模型做阅读、写作类应用，但如果想要在数学能力上有突破，就需要研发新的大模型。

因此，学而思决心组建团队专研MathGPT——数学领域大模型，用自己在数学和AI上的多年积累，面向全球范围内的数学爱好者和科研机构，做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题：

第一，题目要解对，现在GPT结果经常出现错误；

第二，解题步骤要稳定、清晰，现在GPT的解题步骤每次都不一样，而且生成内容经常很冗余；

第三，解题要讲的有趣、个性化，现在GPT的解释过于「学术」和机械，对孩子的学习体验很不友好。

做MathGPT，学而思凭什么

学而思作为获国家科技部批准的「智慧教育国家新一代人工智能开放创新平台」建设单位，也是教育行业唯一一家人工智能「国家队」成员，在人工智能领域有着多年的深入研究，早在2017年，学而思便成立了AI lab人工智能实验室。

据公开信息显示，基于智慧教育人工智能开放创新平台助力，学而思AI lab获得各类顶级学术会议比赛冠军16项，亚军6项；发表国际期刊和会议高水平学术论文31篇，包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究，在计算机视觉顶会以及自然语言顶会中均有多篇论文发表；申请专利220余项，授权专利150余项，软件著作权60余项。

学而思研发面向全球数学爱好者大模型MathGPT 学而思AI lab在各类顶级学术会议比赛获奖情况

「以数学起家」的学而思至今已有20年的数学教学经验，积累了庞大的数学相关数据，这些数据是进行MathGPT训练的必备物料。

另外，学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢，学而思的学生在每年的IMO和AMC等国际数学竞赛中表现优异，每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以，学而思选择在MathGPT方向发力也顺理成章。

另据了解，学而思学习机近期将会上线一款「AI助手」，涵盖作文助手、口语助手、阅读助手、数学助手等相关功能，该AI产品将于5月11日开启内测。