首个数学领域的教育垂直大模型上线。
8月24日,时值好未来(NYSE:TAL)20周年,好未来CTO田密在直播活动中宣布,该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。
(资料图片)
今年5月,好未来曾公布正在进行自研数学大模型的研发,由CTO田密牵头,命名为MathGPT。主要面向全球数学爱好者和科研机构,以解题和讲题算法为核心。
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端。
据好未来提供的MathGPT技术报告显示,在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中,MathGPT的表现不差。
多个大模型在六个公开数学评测集合的正确率表现,图源:好未来
其中,以微软华人研究团队发布的基准测试AGIEval为例,Open AI推出的GPT-4、好未来的MathGPT的正确率分别为%、%;但在Math401评测中,GPT-4略胜一筹,正确率高出个百分点。
ChatGLM2、GPT-4、MathGPT在C-Eval的初高中的全科测试表现,图源:好未来
同时,在C-Eval的初高中的全科测试集合上,MathGPT的表现成绩也普遍高于GPT-4和清华团队推出的第二代中英双语对话模型ChatGLM2。
一个普遍共识是,通用大模型“重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。即使是表现优异的GPT-4也曾在鸡兔同笼的基本数学问题上“栽跟头”。相比大模型更擅长的语文、英语,数学更偏逻辑思维、推理能力,大模型研发难度也更高。
“数学光喂内容没用,因为它是原理问题,现有技术没法做到套一下就能使用(的地步)。”网易有道(NYSE:DAO)CEO近期在媒体交流时表示,相反,如果是文字语言型的应用,不需要特别强的推理。从现有时间经验来说,英语、语文比数学的评测结果更理想,速度也更快。
作为曾经数学培训的头部公司,好未来积累了大量的数学数据和生产能力。2017年,成立AI lab开启人工智能研究。之所以研发数学垂直大模型,该公司称“在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做相关研究。”
“AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。”田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。
在AI能力的加持下,“学生自学+AI答疑”的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导。
好未来正与中国信通院、复旦大学、科大讯飞()、百度()等科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。
大模型训练、运营及维护需要大量专业人才,好未来目前还在招兵买马。
MathGPT官网显示,其招聘岗位包括大模NLP算法工程师、大模型训练&推理加速工程师、MathGPT产品经理、AI后台Golang开发工程师、资深UI设计师(AI方向),以及用户研究。其中,前两个岗位的工作地点不局限于国内,还包括美国旧金山湾区的库比蒂诺(Cupertino),被称为“硅谷的心脏”,苹果公司总部也位于此。
在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。
据田密透露,随着公测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。
(文章来源:界面新闻)
下一篇:最后一页
首个数学领域的教育垂直大模型上线。8月24日,时值好未来(NYSE:TAL)
微信图片_202308241710288月24日16时,重庆市规划和自然资源局、重庆市
尔康制药公告,公司近日收到国家药监局核准签发的《药品补充申请批准通
8月23日上午,宣汉县第二中学举行高2023级新生军训动员大会。宣汉县人
据中国驻缅甸大使馆微信公众号消息,8月24日,5名电信诈骗犯罪嫌疑人在
今日,记者从郑州公交集团了解到,8月17日,郑州市交通运输局公示了《
Youtube频道WanderingDutch发布了《极限竞速Motosport》的最新演示视频。
美国共和党提名总统候选人预选阶段的首场电视辩论23日晚在威斯康星州密
阿根廷、埃及、埃塞俄比亚、伊朗、沙特阿拉伯、阿联酋获邀加入金砖国家
截至2023年8月24日收盘,欧晶科技(001269)报收于51 2元,上涨3 23%,换
《家在黄河边》作词:向涵张平作曲:蒙根朝鲁演唱:张平太阳嘛黄灿灿,
中工网讯(记者王鑫)8月24日,全国总工会京东物流蹲点组和京东集团工
8月24日,交通运输部召开8月份例行新闻发布会。会上,北青报记者了解到
近日,记者了解到本届全国“村BA”西北赛区比赛落地宁夏回族自治区固原
美浮特当即决定全力生产,尽可能向灾区群众捐献消毒防疫物资,为灾区重
阿里巴巴国际站首次发布全链路外贸AI产品,拥有智能商品发布与管理、市
大家好,最近小红发现有诸多的小伙伴们对于男子空中技巧世锦赛,男子空
投资要点事件:8月21日,财政部印发《企业数据资源相关会计处理暂行规
8月23日上午,2023年丘陵山区农业机械化发展论坛在西华大学郫都校区举
导读1、走在风中今天阳光突然好温柔天的温柔地的温柔像你抱着我然后发
8月23日上午,2023年秋季全省高质量发展重大项目建设现场推进会举行,
8月23日17时30分许,山西省忻州市五台县境内的沧榆高速凤凰岭隧道内,
8月23日,东江环保(002672)融资买入577 94万元,融资偿还593 01万元
近日,记者了解到本届全国“村BA”西北赛区比赛落地宁夏回族自治区固原
8月23日,威高骨科(688161)融资买入145 49万元,融资偿还437 9万元,
r谷氨酰转肽酶偏高的原因124会导致胸闷么,r谷氨酰转肽酶偏高这个很多
甘肃临夏州临夏县城区全貌。林颖轩摄中新网甘肃新闻8月22日电(艾庆龙)
千古百业兴,先行在交通。临夏市环城北建设项目,一条承载民众期盼、促
民族日报·中国临夏网讯(记者马麒通讯员王慧娴)为进一步完善治理河道
民族日报·中国临夏网讯(记者马博文)8月22日上午,州委副书记、州长