现代汉语常用词表

现代汉语常用词表》项目是由中国国家语言文字工作委员会组织实施,在1998年7月启动,2008年11月《现代汉语常用词表》(草案)由商务印书馆出版。该词表是作为国家已经公布的《现代汉语常用字表》等的配套规范,服务于语言文字规范化、语文教育和相关研究,可供中小学语文教学、扫盲教育、汉语教育、中文信息处理和辞书编纂等方面参考、采用。

常用词检测词频的语料库有三种:一是国家语委研制的“现代汉语通用语料库”核心语料库,这个通用语料库收有4500万字语料,缺点是有的词年代久远,如今已不经常使用。二是《人民日报》2001年至2005年约1.35亿字的分词标注语料;第三种是厦门大学研制的现当代文学作品语料库,约7000万字语料,总共2.5亿字。

据悉,常用词表将每5至10年修订一次。

另見

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.