科大讯飞付瑞吉:机器评分已经应用于安徽、江苏高考| 搜狐科技AI峰会

基于口语评测技术启发,我们进行智能评阅研究,就是面向纸笔考试,口语评测和智能阅卷进行对比,也会扫描阅卷图片。语音评测一方面是对发音的准确性进行评价,另一方面是对文本语义进行评价,通过语音识别转化成为文字,综合在一起就会变成口语评测的结果。我们的智能评阅也是这样,图片进来以后首先会对书写质量评价,然后进行图文识别,并且对语义层面进行评价,非常的相似。

我们就拿最难的作文自动评阅技术来讲,实际上是对学生的中英文作文进行自动评分和批改,一方面是减轻阅卷员的阅卷负担,另一方面是便于评分的质检,保证考试的公平公正,应用于两大方向,一是大规模考试,二是日常教学。

这是一个简单的技术框架,作文自动评分参考中高考的评分标准,然后作为我们考察的维度,通过机器学习进行评分模型的训练,然后可以对考试的试卷进行自动评分,批改是在此基础上进行错误的检测,然后给考生一些反馈,主要也是应用在日常的教学过程当中。

我们来看语法检错。这方面需要检测语法当中缺词、多词、用词不当的样例和错误,(我们)去年参加了国际的语法检错大赛并且获得冠军,我们会把这项技术应用于作文评分错误检测以及作为评分维度使用。一篇作文比较复杂,谋篇布局是什么样子,通过全局和局部的语音关联技术可以把作文当中的论点、论据和相关决策识别出来,一篇文章的脉络就能够清楚地展现在我们面前,结构的好坏可以作为评分的标准依据。

表达方式就是记叙、描写和抒情,相关的表达方式都可以识别出来,作为我们评分的标准,比如有些好的作文可能描写会比较丰富和细腻,我们把它作为特征使用,修辞手法就不详细讲了,采用多任务识别的过程,比如通常的比喻、拟人、排比等等修辞,文本的相似度检测就是检测抄袭前面的阅读理解,这些在大规模考试当中老师都是很难发现的。

大规模应用考试就是中高考的考试,规模是几万人到几十万人,需求主要是质检或者替代人工评分,日常教学当中规模会小一些,平常的周测和月考等等,但是需求会更多一些,除了评分之外还需要批改的结果,因为平常的教学过程当中只给学生评分是起不到提高的作用,也需要给学生一些反馈,也需要给老师报告,就是你所在的班级当中评分作文的情况,便于老师进行教学。

我们来看应用的情况,大规模考试的过程当中,近几年我们在多地的中高考进行应用,比如安徽和江苏当中的高考进行应用,主要用于质检,实际上是在人工评分的同时进行机器评分,发现人工评分和机器评分有很大分差的话就会请专家进行仲裁评分,如果有问题就进行修正。当然,英语作文、简答题和数学等等考试当中都有应用,专家针对这种辅助技术的使用也给予好评,使得我们的人工智能技术在各地的推广奠定了基础。这是《中国考试》期刊上发表的两篇论文,很多数据也是从论文当中摘取。

日常的教学使用主要是针对字词语法抄袭的常见问题进行辅助诊断,帮助老师减负,我们在2000多所学校里三年以来的累计服务增长了十余倍,助力近万名老师。

以上就是我的分享,谢谢大家!

实际上,AI与各行各业的结合已经深入肌理,传统行业都在面临着前所未有的变革窗口期。借助AI实现企业的转型升级,已经从以往的锦上添花变成了如今迫在眉睫。AI将如何重塑行业,行业需求又如何倒逼AI技术的发展,成为了值得探讨的问题。

大会上午的主论坛共分为“AI重点相关技术”与“AI重点场景应用”两大板块,除了邀请中国工程院院士邬贺铨、搜狗公司CEO王小川、三星电子中国研究院院长张代君为我们解读AI发展的最新进展外,还邀请了来自IoT、零售、自动驾驶、金融、医疗五个领域的知名大咖来分享AI与行业的结合。而下午的分论坛则更为聚焦,深入探究AI如何改造零售、教育这两个关乎国计民生的行业。

除本篇外,搜狐科技还针对此次大会进行了全方位的报道,敬请关注本次峰会专题!

PC端:http://it.sohu.com/sptopic/19-155-kb-bdb/kejiai2019pc.html

手机端:http://it.sohu.com/sptopic/19-156-kb-06e/kejiai2019wap.html

(搜狐科技原创文章,转载请注明来源。)返回搜狐,查看更多

发表评论

电子邮件地址不会被公开。 必填项已用*标注