广告

高考机器人惜败人类状元,输在“语文是程序员教的”

2017-06-08 11:26:20 网络整理 阅读:
2017年6月8日,是中国恢复高考制度 40 周年。早前我们就了解到,今年将有两位特别的考生会亮相高考,它就是成都“准星数学高考机器人AI-MATHS“,以及北京的智慧教育机器人Aidam。
广告

6月7日晚间,AI-MATHS在断网断题库的情况下完成了北京文科数学卷和全国二卷数学卷,分别用时22分钟与10分钟,考试成绩也于当天揭晓,分别为105与100分(两套试卷的总分均为150分)。这一分数说不上是数学“学霸”,不过还算差强人意。毕竟,AI-MATHS研发团队设立的高考目标分也才110。

靠“刷题“提升,考试时需断网

像普通高考考生一样,AI-MATHS也靠大量“刷题”提升水平。今年2月,AI-MATHS仅靠100套试题的训练量,在一次模拟考中取得了93分的成绩。2月份之后,为了训练AI-MATHS的答题速度,团队加大了题量,目前AI-MATHS已有500套试题的积累,这次AI-MATHS算是超越自己了吧。
20170608-ai-gaokao-0
▲ AI-MATHS现场答题(Source:澎湃新闻)

资料显示,AI-MATHS是成都高新区一家本土人工智能企业研发,以自动解题技术为核心的人工智能系统,诞生于2014年,在2016年5月宣布参加今年高考数学试卷。业界透露,让机器人参与高考,旨在测试机器人能达到什么样的人工智能水平,然后在更多地方应用AI成果。

AI-MATHS由10余台服务器组成,“考场”设在成都天府新谷10号楼的一个会议室里。像考生会被切断与外界的联系一样,开始答题时这些服务器也会被切断网络连接。由公证机构和媒体出任“监考老师”。
20170608-ai-math
▲ AI-MATHS主机

据了解,准星AI-MATHS近1年多来,在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关。它是通过综合逻辑推理平台来解题,而非学习储存题库。本次挑战的结果也将运用到该公司对AI-MATHS的技术验证中,帮助AI-MATHS早日从“学生”变成“老师”。
20170608-ai-gaokao-1
▲ 现场老师给AI-MATHS评卷(Source:成都发布)

Aidam机器人大战六名高考理科状元

北京这边战况更加惨烈,教育机构“学霸君”自行研发的智慧教育机器人Aidam与六名高考理科状元同台对决,共同解答今年高考文科数学试题,满分为150分。结果Aidam的成绩为134分,六名状元为135分,险胜。

昨天(6月7日)晚间六点四十分,Aidam开始答题。这不是一个普通的高考考场大约三百平方的大厅里,循环大声播放着一首钢琴曲,时不时还有女主持人和嘉宾对话——明显比考场嘈杂多了。
20170608-ai-gaokao-5
▲Aidam和六名学霸同时开始答题

Aidam仅仅经历九分四十七秒就答题结束。学霸君创始人张凯磊坦言自己很紧张,“就像送自己的女儿参加高考”。他表示,为了展示,Aidam昨天答题放慢六倍速度,平时每道题完成时间应该在七至十五秒。
20170608-ai-gaokao-3
▲学霸君创始人张凯磊讲解Aidam解题原理

Aidam放慢的原因是不仅需要把题目做对,还需要给大家展示他是如何做到的。根据要求,Aidam会通过礼堂前部的大屏幕来展示:左边是一个由无数蓝色光点组成的大脑,每算一道题,蓝色大脑里就会跳出若干以红色、黄色、蓝色节点构建的知识链。每个节点旁边有一行白色的字,标注着这道题涉及了哪些知识。
20170608-ai-gaokao-4
▲Aidam解题全程展示

六名高考状元在高考数学结束拿到试题后,即开始答题,答题时间是五十五分钟。人机双方分别完成了包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。

经过数学特级老师、奥赛教练韩兆勇的评审,Aidam的分数最终公布:134 分。三组高考状元陪他一起进行测试,状元一组得分119分。状元二组得分140分。状元三组得分146分。三组高考状元平均分135分,Aidam以 1 分之差惜败于最精英的人类“做题家”。
20170608-ai-gaokao-2
2016年河北省理科状元孟祥熙现就读于北京大学光华管理学院,他受访时表示,“人机大战赢了很开心,但是机器人技术很先进,想知道自己解题错在哪里”。

以拍照搜题为最初产品的学霸君,其产品已经有 6000 万注册用户,答题搜索次数超过 60 亿,老师在线答疑超过 500 万次。这一庞大的题库和数据积累为 Aidam 的发展打下了基础,“我发现,原来在我们的题库里面我们记录了大量的关于状态之间可跳转、可推演、可演算、可关联的信息。” 在讲解 Aidam 的背后逻辑的时候,学霸君的首席科学家陈锐锋使用了围棋作为比喻。

类似于围棋棋盘可以被分为无数横轴和纵轴。人的思维模式和解题模式也可以被具象为棋子,棋子的纵轴与横轴分别代表起始的状态和下一步的状态,这样,每一次题目的可能解法,就相当于在一个庞大思维矩阵里下棋的过程。而学霸君此前积累的庞大的题库与数据记录,恰恰类似于无数张围棋棋谱,为人工智能自主学习提供了可能性。

高考机器人的意义在哪?

机器人参加高考,并不是所谓的 “ 人机大战 ” 后才出现的噱头。在国家层面,“ 高考机器人 ” 是国家863计划信息技术领域 “ 基于大数据的类人智能关键技术与系统 ” 项目的重要研究目标之一。该项目由科大讯飞联合30多家科研院校和企业共同参与,早在2015年便已立项。

“ 高考机器人 ” 有多方面的意义:聚集国内的一些比较顶级的研究机构和科学家,一起来攻关现在人工智能领域相关的一些重要的技术问题;替代传统测试人工智能水平的 “ 图灵测试 ” ,全方面测试和应用与人工智能相关的多个领域;最后将这些领域攻关所取得的技术成果,运用到相关行业和领域,如翻译和车载控制等。

尽管目标类似,但不同的背景决定了AI-Maths和Aidam的不同的解题思路,甚至在一定程度上截然相反:准星云学的 AI-Maths 与 863 计划的高考机器人的思路一致,强调 “ 不联网、不连接题库、无人工参与 ”。在只有少量训练样本的情况(只有约500套试卷、1万道题的训练量)以机器建立类似人类的复杂逻辑推理能力与联想能力。试图让机器在较少样本和较少资源耗费的情况下,拥有“举一反三”能力。而学霸君的思路则强调大题库(已经有超过7000万的巨大题库),通过海量的题库,用户行为数据,以及 Ai 自我博弈,从海量题目中找到适合共通的知识组件和解题模式。
20170608-ai-gaokao-6
▲AI-Math解题全程断网断库,全凭“学习来”的知识

从某种角度说,这两种模式的区别类似于Alphago 早期版本的学习过程,计算机可以通过规则自己对弈,也可以学习棋谱。从此前的测试中看,Aidam 的成绩要好于 AI-Maths,但如果以纯粹人工智能的难度和多行业的延展性,AI-Maths 要略高一筹。

机器人的语文可能是数学老师教的

但为何这次AI-MATHS机器人无论是目标分还是实际成绩都没有非常高呢?澎湃新闻调查表示,因为AI-MATHS对自然语义的理解还有点弱。

比如北京文科数学卷这题:
20170608-ai-gaokao-1
▲ AI-MATHS答不出来的数学题(Source:成都发布)

AI-MATHS没能答出来,不是因为计算问题,而是机器不理解提问的意思。

一言以蔽之,这个机器人考生的数学成绩,败给了自己的语文水平。负责改卷的成都七中高级教师祁祖海指出,AI-MATHS错误题的共同点是文字太多,但它的计算题和证明题做得不错,分数算中等水平,正常学生能考110分左右。

据了解,AI-MATHS 学习了小学到高中的 7000 多个考点,运算量可达到 2 的 800 次方,其研发团队准星云学的创始人林辉认为,跟 AlphaGo 相比,高考机器人的研发难度更大,因为要让系统准确理解人类语言。人类的语言千变万化,而且还在不断创新,几乎是学不完的。遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。比如,正切(tangent)的缩写,近年来的教材和试题里面都用的是“tan”,但早些年用过“tg”。团队在训练AI-MATHS用的题都是“tan”,最近突然让它做了一道“tg”的题,它就懵了。

不仅是AI-MATHS,我们发现Siri、微软小娜等聊天机器人也场景提问下的回答也不够灵活与聪明,这也是因为它们对自然语言的理解能力还不够强。

两部机器人高考成绩出炉后,也引发了网友热议,虽然嘲弄居多,但也有网友笑说“马云第一次高考,数学才考1分呢,机器人很厉害了”。不知道前段时间怒怼AlphaGo的马爸爸听后有什么感想:)

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 消灭“药丸屏”设计,苹果发布iPhone屏下Face ID“隐身术”的新专利 苹果的这项专利展示了其在屏下技术上的重大突破,尤其是在iPhone和MacBook设备上。对于iPhone而言,这项技术有望彻底消除刘海设计,使得设备拥有更加简洁和一体化的外观。
  • 2025年全球半导体行业10大技术趋势 2024年,全球半导体行业虽然未全面复苏,但生成式人工智能、汽车电子和通信技术的快速发展为2025年的技术进步奠定了坚实基础,为行业在新一年中回暖带来了新的希望。基于与业内专家和厂商的交流,本文总结了2025年全球半导体行业的10大技术趋势,探讨这些技术的发展方向和市场前景。
  • 下一代半导体氧化镓基光电探测器的应用与测试研究 光电探测器的性能因材料不同、结构不同、制备工艺及应用场景的不同而存在较大的差异。性能指标之间往往存在制约,如暗电流与输出电流、灵敏度与响应度、可靠性与灵敏度等需要权衡。对于性能表征也是如此,例如高响应度与高精度电流表征无法同时进行。
  • 将电流感应集成到宽禁带电源转换器的挑战 由于在满足所有要求方面存在不同的权衡,因此很难采用一种适用于所有情况的电流检测方法。
  • 2024年Q3传感器市场:近9成上市企业同比正增长! 整体来看,2024年前三季度中国传感器上市企业经营业绩整体表现良好。其中,韦尔股份、华工科技、思特威、汇顶科技等营收和净利润均有显著增长。韦尔股份则以近190亿元营收、24亿元净利润独占鳌头。
  • 拆解:传说中的星闪技术,如何做到低延迟连接的? 听说北通阿修罗2 Pro+星闪版手柄玩《黑神话:悟空》很流畅。它能够实现如此高的回报率是用的哪颗芯片?它的体感操控技术又是靠哪颗芯片实现的?小编好奇地把它拆开来看了看……
  • 含硅还是不含硅? 大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
  • CES 2025:芯科科技CTO Daniel Co 在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
  • NFC防伪技术:削弱假货对奢侈品行业 虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
  • 西门子更新Simcenter解决方案,增强 西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
  • 联想收购存储解决方案商Infinidat 1 月 17 日消息,联想集团 1月16 日宣布其附属公司已达成最终协议,将收购全球高端企业存储解决方案提供商 Infinidat。该交易的正式成交尚待惯例监管批准并满足其它条件,双方并未透露这笔交易
  • 沃尔沃2025:踏过千重浪|特辑 文|温风回顾完过去,再聊聊新的一年,沃尔沃从产品层面,还有哪些亟待解决的问题?首先是纯电高端化的挑战。这不是沃尔沃一家的命题,宝马i5/i7,奔驰EQE/EQS,没有一款对自身旗下传统动力车型产生强烈
  • 荣耀迎来新掌门人:前华为悍将李健 荣耀正站在品牌独立第五年和IPO的关键时刻。美通社消息,1月17日,荣耀终端股份有限公司发布公告,宣布了最新的高管任职:赵明先生因个人原因辞去公司董事、CEO等相关职务,董事会决定由李健先生接替赵明先
  • 搭载AndroidAutomotive系统的汽车即将拥有更多应用程序 点击蓝字 关注我们SUBSCRIBE to USImage: Umar Shakir / The Verge谷歌将于今年2月(25年2月)推出其Android Automotive应用转换计划,该计划
  • 是德科技推出一体化的网络可视化和安全解决方案 该计划旨在降低成本,减少网络风险和运营的复杂性首批合作伙伴包括 Forescout、Instrumentix 和 Nozomi Networks是德科技(NYSE:KEYS)推出网络可视化合作伙伴计划
  • 几张动图让你快速了解三极管     三极管的电流放大作用应该算是模拟电路里面的一个难点内容,我想用这几个动画简单的解释下为什么小电流Ib能控制大电流Ic的大小,以及放大电路的原理。    我这里的三极管也叫双极型晶体管,模电的放
  • 联想计划本财年内将印度生产的智能手机和笔记本电脑数量翻番 目前,联想已经在印度工厂生产笔记本电脑和台式电脑,后续还将生产 AI 服务器,而摩托罗拉智能手机、平板电脑和笔记本电脑也在由代工商 Dixon Technologies 进行生产。联想印度公司总经理
  • 联创电子预计2024年净亏损2.8-5.5亿元 1月20日晚,联创电子科技股份有限公司(以下简称“联创电子”)发布了其2024年度业绩预告。           数据显示,联创电子预计2024年实现营业收入92.7亿元至103亿元,同比变化区间为-
  • 轻舟智航侯聪:追求极致性价比,而非极致体验 作者 | 章涟漪编辑 | 邱锴俊1套产品方案全新升级、1个客户量产新定点、2轮数亿元新融资、超50万NOA量产上车……1月16日,轻舟智航举行媒体沟通会,轻舟智航总裁侯聪、CTO李栋复盘了公司2024
  • 中国台湾突发6.4级地震,台积电部分厂区停机人员疏散! 根据中国台湾气象署所发布的报告显示,中国台湾南部地区于1月21日上午零点17分27秒发生里氏地震规模6.4的地震,震中位于北纬23.23度,东经120.57度,即在嘉义县政府东南方37.9公里,位于嘉
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了