Apparatus and method for dividing document including table

   
   

A table in an HTML document is analyzed to generate cell position data indicating a positional relationship between cells and cell vectors representing characteristics of the cells, and a table type is judged with reference to the cell position data and the cell vectors, and, if the table type is a table describing a table, it is judged whether the data is represented in a column or a row with reference to the cell position data and the cell vectors, and a cut direction of the table is determined, and segments are generated with reference to the table type and the cut direction. If the table type is a table for layout, the cells are clustered with reference to the cell vectors, and the segments are generated with reference to the cell position data and cell cluster information.

Ένας πίνακας σε ένα έγγραφο HTML αναλύεται για να παραγάγει τα στοιχεία θέσης κυττάρων που δείχνουν μια θεσιακή σχέση μεταξύ των κυττάρων και των διανυσμάτων κυττάρων που αντιπροσωπεύουν τα χαρακτηριστικά των κυττάρων, και ένας επιτραπέζιος τύπος κρίνεται σε σχέση με τα στοιχεία θέσης κυττάρων και τα διανύσματα κυττάρων, και, εάν ο επιτραπέζιος τύπος είναι ένας πίνακας περιγράφοντας έναν πίνακα, αυτό κρίνονται εάν το στοιχείο αντιπροσωπεύεται σε μια στήλη ή μια σειρά σε σχέση με τα στοιχεία θέσης κυττάρων και τα διανύσματα κυττάρων, και μια κατεύθυνση περικοπών του πίνακα καθορίζεται, και τα τμήματα παράγονται σε σχέση με τον επιτραπέζιο τύπο και την κατεύθυνση περικοπών. Εάν ο επιτραπέζιος τύπος είναι ένας πίνακας για το σχεδιάγραμμα, τα κύτταρα είναι συγκεντρωμένα σε σχέση με τα διανύσματα κυττάρων, και τα τμήματα παράγονται σε σχέση με τα στοιχεία θέσης κυττάρων και τις πληροφορίες συστάδων κυττάρων.

 
Web www.patentalert.com

< Image forming device control system and method

< Detection and removal of image occlusion errors

> Coding apparatus and method

> Image processing apparatus

~ 00166