词语搭配

语料库语言学词语搭配(Collocation)是指按顺序排列的单字或者术语同时出现的次数比偶然的多。在片语学phraseology)中词语搭配是惯用片语(phraseme)的子类别。一个措辞上的词语搭配的例子,如韓禮德[1]提出的语言表达式strong tea(而不是*powerful tea)。

词语搭配这个词的定义在语言学界中是最受争论的之一[2]

词语搭配在机器翻译等任务中能有所应用。而 Linggle[3] 是全世界第一套搭配詞搜尋引擎。

用于搭配提取的公式[4]

  • 互信息
  • t测试
  • z测试
  • Chi方测试
  • 似然比

此外,在[5]中罗列了84个可用于此任务的公式。

参考文献

  1. Halliday, M.A.K., 'Lexis as a Linguistic Level', Journal of Linguistics 2(1) 1966: 57-67
  2. Evert, S. . 2008.
  3. Joanne Boisson; Ting-Hui Kao, Jian-Cheng Wu, Tzu-Hsi Yen, Jason S. Chang. . Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013.
  4. Manning, C. D. . MIT Press. 1999.
  5. Pecina, P. : 13. 2005.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.