A word breaking facility operates to identify words within a Japanese text string. The word breaking facility performs morphological processing to identify postfix bound morphemes and prefix bound morphemes. The word breaking facility also performs opheme matching to identify likely stem characters. A scoring heuristic is applied to determine an optimal analysis that includes a postfix analysis, a stem analysis, and a prefix analysis. The morphological analyses are stored in an efficient compressed format to minimize the amount of memory they occupy and maximize the analysis speed. The morphological analyses of postfixes, stems, and prefixes is performed in a right-to-left fashion. The word breaking facility may be used in applications that demand identity of selection granularity, autosummarization applications, content indexing applications, and natural language processing applications.

Una palabra que rompe la facilidad funciona para identificar palabras dentro de una secuencia de texto japonesa. La palabra que rompe la facilidad realiza el proceso morfológico para identificar morfemas encuadernados del posfijo y para prefijar morfemas encuadernados. La palabra que rompe la facilidad también realiza el opheme que empareja para identificar caracteres probables del vástago. El anotar heurístico se aplica para determinar un análisis óptimo que incluya un análisis del posfijo, un análisis del vástago, y un análisis del prefijo. Los análisis morfológicos se almacenan en un formato comprimido eficiente para reducir al mínimo la cantidad de memoria que ocupan y que maximizan la velocidad del análisis. Los análisis morfológicos de posfijos, de vástagos, y de prefijos se realizan en una manera derecho-a-izquierda. La palabra que rompe la facilidad se puede utilizar en los usos que exigen la identidad del granularity de la selección, de los usos del autosummarization, de los usos contentos de la indexación de direcciones, y de los usos del proceso de lengua natural.

 
Web www.patentalert.com

< (none)

< Method and system for bootstrapping statistical processing into a rule-based natural language parser

> Method for automated electromigration verification

> (none)

~ 00002