Method for segmenting multi-resolution video objects

   
   

A method for segmenting video objects in a video sequence that is composed of frames including pixels first assigns a feature vector to each pixel of the video. Next, selected pixels are identified as marker pixels. Pixels adjacent to each marker pixel are assembled into a corresponding a volume of pixels if the distance between the feature vector of the marker pixel and the feature vector of the adjacent pixels is less than a first predetermined threshold. After all pixels have been assembled into volumes, a first score and descriptors are assigned to each volume. At this point, each volume represents a segmented video object. The volumes are then sorted a high-to-low order according to the first scores, and further processed in the high-to-low order. Second scores, dependent on the descriptors of pairs of volumes are determined. The volumes are iteratively combined if the second score passes a second threshold to generate a video object in a resolution video object tree that completes when the combined volume or video object is the entire video.

Eine Methode für die Segmentierung der videogegenstände in einer videoreihenfolge, die aus Rahmen einschließlich Pixel zuerst besteht, weist einen Eigenschaft Vektor jedem Pixel des Bildschirmes zu. Zunächst werden vorgewählte Pixel als Markierung Pixel gekennzeichnet. Pixel neben jedem Markierung Pixel werden in entsprechen ein Volumen Pixel, wenn der Abstand zwischen dem Eigenschaft Vektor des Markierung Pixels und dem Eigenschaft Vektor der angrenzenden Pixel kleiner ist, als eine erste vorbestimmte Schwelle zusammengebaut. Nachdem alle Pixel in Volumen zusammengebaut worden sind, werden eine erste Kerbe und Beschreiber jedem Volumen zugewiesen. An diesem Punkt stellt jedes Volumen einen segmentierten videogegenstand dar. Die Volumen werden dann einem hoch-zu-niedrigen Auftrag entsprechend den ersten Kerben sortiert, und weiteres verarbeitet im hoch-zu-niedrigen Auftrag. Die zweiten Kerben, die von den Beschreibern von Paaren Volumen abhängig sind, werden festgestellt. Die Volumen werden wiederholend kombiniert, wenn die zweite Kerbe eine zweite Schwelle führt, um einen videogegenstand in einem Auflösung videogegenstandbaum zu erzeugen, der durchführt, wenn der kombinierte Volumen- oder Bildschirmgegenstand der gesamte Bildschirm ist.

 
Web www.patentalert.com

< Fractal image compression using reinforcement learning

< Flattening images with abstracted objects

> Word recognizing apparatus for dynamically generating feature amount of word and method thereof

> Method for eliminating blocking effect in compressed video signal

~ 00164