Text is summarized using part-of-speech (POS) data indicating parts of speech for tokens in the text. The POS data can be obtained using input text data defining the text, such as by POS tagging. The POS data can be used to obtain group data indicating groups of tokens of the text, such as verb groups and noun groups. The group data can also indicate, within each group, any tokens that meet a POS based removal criterion. The group data can be used to obtain summarized text data by removing tokens that meet the removal criterion. The original text may be obtained via scanner or video camera from a user's document, and may be recognized to obtain input text data. The summarized text may output as text or as audio pronunciation using a speech synthesizer.

Il testo è ricapitolato usando i dati di parte del discorso (posizione) che indicano le parti del discorso per il segno nel testo. I dati di posizione possono essere ottenuti usando i dati del testo di entrata che definiscono il testo, come etichettando della POS. I dati di posizione possono essere usati per ottenere i dati del gruppo che indicano i gruppi del segno del testo, quali i gruppi di verbo ed i gruppi nominali. I dati del gruppo possono anche indicare, presso ogni gruppo, tutto il segno che rispondono ad un test di verifica basato posizione di rimozione. I dati del gruppo possono essere usati per ottenere i dati ricapitolati del testo rimuovendo il segno che rispondono al test di verifica di rimozione. Il testo originale può essere ottenuto via video o del dispositivo d'esplorazione la macchina fotografica dal documento dell'utente e può essere riconosciuto per ottenere i dati del testo di entrata. Il testo ricapitolato può produrre come testo o come pronuncia audio per mezzo di un sintetizzatore della voce.

 
Web www.patentalert.com

< (none)

< Single pass, multicolor contact electrostatic printing system

> Non-leaking and easily remanufactured toner cartridge

> (none)

~ 00014