北京邮电大学学报

  • EI核心期刊

北京邮电大学学报 ›› 2016, Vol. 39 ›› Issue (4): 92-97.doi: 10.13190/j.jbupt.2016.04.018

• 研究报告 • 上一篇    下一篇

基于语料库的英语文章语法错误检查及纠正方法

谭咏梅, 王晓辉, 杨一枭   

  1. 北京邮电大学 智能科学与技术中心, 北京 100876
  • 收稿日期:2015-12-11 出版日期:2016-08-28 发布日期:2016-08-28
  • 作者简介:谭咏梅(1975-),女,副教授;王晓辉(1990-),男,E-mail:w9x2h1@qq.com.

Grammatical Error Correction Based on Corpus

TAN Yong-mei, WANG Xiao-hui, YANG Yi-xiao   

  1. Intelligence Science and Technology Center, Beijing University of Posts and Telecommunications, Beijing 100876, China
  • Received:2015-12-11 Online:2016-08-28 Published:2016-08-28

摘要: 提出一种基于语料库的规则自动抽取方法,在此基础上提出了有限回退算法对英语文章进行语法错误检查及纠正. 该方法在2013年CoNLL语法自动检查及纠正评测数据上总体F1为31.96%,超过第1名的31.20%,在冠词错误的纠正方面F1为33.45%,超过2013年最好成绩33.40%,在名词错误的纠正方面F1为45.31%,超过2013年最好成绩44.35%.

关键词: 语料库, 自动规则抽取, 有限回退, 错误检查及纠正

Abstract: Grammatical error correction(GEC) is the task of detecting and correcting grammatical errors in text written by non-native English writers. A limited back-off algorithm and corpus approach was proposed to handle the grammatical error problem in English text, useful and effective for GEC task. The GEC system yields F1 score of 31.96% on the publicly available CoNLL-2013 shared task data, outperforming the first one with 31.20%.

Key words: corpus, automatic rule extraction, limited back-off, grammar error correction

中图分类号: