R*树

R*树R树的一种变体,可用来建立索引空间信息。R*树的构造花费比标准R树略高。例如数据可能需要被重新插入,但这通常能获得更好的查询性能。像标准R树一样,它能存储点和空间数据。它在1990年由Norbert Beckmann,Hans-Peter Kriegel,Ralf Schneider,和Bernhard Seeger提出。[1]

R*树和R树的不同

由反复插入构建的R*树 (in ELKI)。 这颗树的重叠较少,因此有很好的查询性能。 红的和蓝的MBRs是索引页,绿的MBRs是叶节点。

coverage和重叠的最小化对于R树的性能至关重要。重叠意味着,对于数据查询和插入,多于一个的树分支需要被扩展(由于这个方法数据将被分裂到许多可能重叠的区域)。 一个最小化的 coverage 改进修剪性能,经常允许从搜索排除 所有页面,特别是负值范围的查询。

在节点溢出时,R*树尝试减少 both, using a combination of a revised 节点分裂算法和强制重插的概念。 这基于观察 that R树结构 are highly susceptible to the order in which their entries are inserted, so an insertion-built (rather than bulk-loaded) structure is likely to be sub-optimal. entries的删除和重插允许他们在树中“找”到一个比原来更适合的位置。

当一个节点溢出,它的一部分entries会被移除并重新插入到树。 (为了避免被随后的节点溢出引起 an indefinite cascade of 重插,重插例程可能只被调用一次 in 树的每一级 when 插入任一新的entry。) This has the effect of producing more well-clustered groups of entries in nodes, 减少节点coverage。 此外, actual node splits are often postponed, causing average node occupancy to rise. 重插能被看作增长树的一种优化方法, 它在节点溢出时被触发。

性能

  • Improved split heuristic produces pages that are more rectangular and thus better for 许多应用。
  • 重插方法优化已经存在的树,但增加了复杂性。
  • 同时高效地支持点和空间数据。

算法和复杂性

  • R*树的查询和删除操作使用和正规R树一样的算法。
  • 插入时,R*树使用一种组合策略。对于叶节点,重叠被最小化,而对于内节点,则enlargement和area被最小化。
  • 分裂时,R*树使用一种拓扑分裂,其选择一条基于perimeter的分裂轴,然后最小化重叠。
  • 除改良的分裂策略外,R*树也尝试通过重插对象和子树来避免分裂,灵感来自平衡一颗B树的概念。

显然,最坏情况下R*树的查询和删除复杂度与R树相当。R*树的插入策略具有的复杂度,它比R树线性分裂策略的复杂度高(),但比R树取页大小为时的二次分裂策略()复杂度低,并且对总复杂度没有太大的影响。R*树总的插入复杂性仍与R树相当。重插至多影响一个树支,因此重插操作具有的复杂度,这与正规R树的分裂操作相当。总体而言,R*树的复杂度与正规R树处于同一数量级。

一个完整的算法实现必须考虑诸多未在此处涉及的邊角案例与特殊情况。

参考资料

  1. Beckmann, N.; Kriegel, H. P.; Schneider, R.; Seeger, B. (PDF): 322. 1990 [2018-04-03]. ISBN 0897913655. doi:10.1145/93597.98741. (原始内容存档 (PDF)于2018-04-17). |chapter=被忽略 (帮助)
  2. Antonin Guttman, Antonin Guttman. . ACM SIGMOD Record. 1984-06-18, 14 (2): 47, 47–57, 57 [2018-04-02]. ISSN 0163-5808. doi:10.1145/602259.602266.
  3. C. H. Ang, T. C. Tan. . Springer, Berlin, Heidelberg: 337–349. 1997-07-15 [2018-04-02]. ISBN 3540632387. doi:10.1007/3-540-63238-7_38. (原始内容存档于2018-06-06) (英语).

外部链接

维基共享资源中相关的多媒体资源:R*树

包含R*树的库:

示例代码:

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.