The Chinese generation apparatus for machine translation utilizes statistic data for Chinese generation instead of a large number of semantic, grammatical related rules, the statistic data being retrieved from a tagged Chinese corpus. In order to overcome the problem that a large number of semantic or grammatical rules are needed in Chinese generation, the constitution of a Chinese sentence is divided into basic sentence pattern item and other items. The probability of the possibly generated basic sentence pattern of each Chinese verb and the location probability of the other item in the basic sentence pattern are initially retrieved from the Chinese corpus and are stored in the buffer unit. The best basic sentence pattern and the location of the other items can be found in accordance with each constitution item of the intermediate form of Chinese and the statistic information in the buffer unit with the use of branch-and-bound method, so that the most suitable Chinese sentence can be generated.

Der chinesische Erzeugung Apparat für maschinelle Übersetzung verwendet Statistikdaten für chinesisches Erzeugung anstelle von vielen semantischen, grammatischen in Verbindung stehenden Richtlinien, die Statistikdaten, die von einem etikettierten chinesischen Korpus zurückgeholt werden. Um das Problem zu überwinden das viele semantische oder grammatische Richtlinien im chinesischen Erzeugung benötigt werden, wird die Beschaffenheit eines chinesischen Satzes in grundlegendes Satzmustereinzelteil und in andere Einzelteile geteilt. Die Wahrscheinlichkeit des vielleicht erzeugten grundlegenden Satzmusters jedes chinesischen Verbs und die Position Wahrscheinlichkeit des anderen Einzelteils im grundlegenden Satzmuster werden zuerst vom chinesischen Korpus zurückgeholt und werden in der Puffermaßeinheit gespeichert. Das beste grundlegende Satzmuster und die Position der anderen Einzelteile können in Übereinstimmung mit jedem Beschaffenheiteinzelteil der Zwischenform des Chinesen und der Statistikinformationen in der Puffermaßeinheit mit dem Gebrauch von Verzweigungsmethode gefunden werden, damit der verwendbarste chinesische Satz erzeugt werden kann.

 
Web www.patentalert.com

< (none)

< Method and apparatus for target addressing and translation in a non-uniform memory environment with user defined target tags

> NPA split management in intelligent network environment

> (none)

~ 00014