A system and method for optimizing I/O to low-level index access during
bulk-routing through a taxonomy to classify documents, e.g., Web pages, in
the taxonomy. In a first optimization, bulk-routing is regarded as a
generalized join operation in a relational database framework. In a second
optimization, instead of processing each document individually through
nodes of the taxonomy, a group of documents are processed node by node in
a wavefront-style routing scheme for better amortization of index probes.
Um sistema e um método para optimizing I/O ao índice de baixo nível alcançam durante o volume-roteamento com um taxonomy para classificar os originais, por exemplo, Web pages, no taxonomy. Em um primeiro optimization, o volume-roteamento é considerado como generalizado junta a operação em uma estrutura da base de dados relacional. Em um segundo optimization, em vez de processar cada original individualmente com os nós do taxonomy, um grupo dos originais é nó processado pelo nó em um esquema do roteamento do wavefront-estilo para o amortization melhor de pontas de prova do índice.