An author-oriented document summarizer for a word processor is described. The document summarizer performs a statistical analysis to generate a list of ranked sentences for consideration in the summary. The summarizer counts how frequently content words appear in a document and produces a table correlating the content words with their corresponding frequency counts. Phrase compression techniques are used to produce more accurate counts of repeatedly used phrases. A sentence score for each sentence is derived by summing the frequency counts of the content words in a sentence and dividing that tally by the number of the content words in the sentence. The sentences are then ranked in order of their sentence scores. Concurrent with the statistical analysis, during the same pass through the document the summarizer performs a cue-phrase analysis to weed out sentences with words or phrases that have been pre-identified as potential problem phrases. The cue-phrase analysis compares sentence phrases with a pre-compiled list of words and phrases and sets conditions on whether the sentences containing them can be used in the summary. Following the cue-phrase analysis, the summarizer creates a summary containing the higher ranked sentences. The summary may also include a conditioned sentence if the conditions established for inclusion of the sentence have been satisfied. The summarizer then inserts the sentence at the beginning of the document before the start of the text.

Ένα συντάκτης-προσανατολισμένο έγγραφο summarizer για έναν επεξεργαστή λέξεων περιγράφεται. Το έγγραφο summarizer εκτελεί μια στατιστική ανάλυση για να παραγάγει έναν κατάλογο ταξινομημένων προτάσεων για την εκτίμηση στην περίληψη. Το summarizer μετρά πόσο συχνά οι ικανοποιημένες λέξεις εμφανίζονται σε ένα έγγραφο και παράγει έναν πίνακα συσχετίζοντας τις ικανοποιημένες λέξεις με τις αντίστοιχες αριθμήσεις συχνότητάς τους. Οι τεχνικές συμπίεσης φράσης χρησιμοποιούνται για να παραγάγουν τις ακριβέστερες αριθμήσεις των επανειλημμένα χρησιμοποιημένων φράσεων. Ένα αποτέλεσμα πρότασης για κάθε πρόταση παράγεται με το άθροισμα των αριθμήσεων συχνότητας των ικανοποιημένων λέξεων σε μια πρόταση και τη διαίρεση που συμπίπτουν από τον αριθμό των ικανοποιημένων λέξεων στην πρόταση. Οι προτάσεις ταξινομούνται έπειτα κατά σειρά τα αποτελέσματα πρότασής τους. Ταυτόχρονο με τη στατιστική ανάλυση, κατά τη διάρκεια του ίδιου περάσματος μέσω του εγγράφου το summarizer εκτελεί μια ανάλυση σύνθημα-φράσης για να βοτανίσει έξω τις προτάσεις με τις λέξεις ή τις φράσεις που προ-έχουν προσδιοριστεί ως πιθανές φράσεις προβλήματος. Η ανάλυση σύνθημα-φράσης συγκρίνει τις φράσεις πρότασης με έναν προσυλλεγμένο κατάλογο λέξεων και τις φράσεις και τους όρους συνόλων εάν οι προτάσεις που περιέχουν τους μπορούν να χρησιμοποιηθούν στην περίληψη. Μετά από την ανάλυση σύνθημα-φράσης, το summarizer δημιουργεί μια περίληψη που περιέχει τις υψηλότερες ταξινομημένες προτάσεις. Η περίληψη μπορεί επίσης να περιλάβει μια ρυθμισμένη πρόταση εάν οι όροι που καθιερώνονται για το συνυπολογισμό της πρότασης έχουν ικανοποιηθεί. Το summarizer παρεμβάλλει έπειτα την πρόταση στην αρχή του εγγράφου πριν από την έναρξη του κειμένου.


< (none)

< Method for producing di-organo alkaline-earth compounds

> Architecture for access over a network to pay-per-view information

> (none)

~ 00027