Search engine with natural language-based robust parsing for user query and relevance feedback learning

   
   

A search engine architecture is designed to handle a full range of user queries, from complex sentence-based queries to simple keyword searches. The search engine architecture includes a natural language parser that parses a user query and extracts syntactic and semantic information. The parser is robust in the sense that it not only returns fully-parsed results (e.g., a parse tree), but is also capable of returning partially-parsed fragments in those cases where more accurate or descriptive information in the user query is unavailable. A question matcher is employed to match the fully-parsed output and the partially-parsed fragments to a set of frequently asked questions (FAQs) stored in a database. The question matcher then correlates the questions with a group of possible answers arranged in standard templates that represent possible solutions to the user query. The search engine architecture also has a keyword searcher to locate other possible answers by searching on any keywords returned from the parser. The answers returned from the question matcher and the keyword searcher are presented to the user for confirmation as to which answer best represents the user's intentions when entering the initial search query. The search engine architecture logs the queries, the answers returned to the user, and the user's confirmation feedback in a log database. The search engine has a log analyzer to evaluate the log database to glean information that improves performance of the search engine over time by training the parser and the question matcher.

Una arquitectura del Search Engine se diseña para manejar una gama completa de las preguntas de usuario, de preguntas oracio'n-basadas complejas a las búsquedas de palabra clave simples. La arquitectura del Search Engine incluye un programa de análisis de la lengua natural que analice una pregunta de usuario y extraiga la información sintáctica y semántica. El programa de análisis es robusto en el sentido que vuelve no solamente los resultados lleno-analizados (e.g., un árbol del análisis), pero es también capaz de volver fragmentos parcial-analizados en esos casos donde está inasequible una información más exacta o más descriptiva en la pregunta de usuario. Una unidad emparejadora de la pregunta se emplea para emparejar la salida lleno-analizada y los fragmentos parcial-analizados a un sistema de preguntas con frecuencia hechas (FAQ) almacenadas en una base de datos. La unidad emparejadora de la pregunta entonces correlaciona las preguntas con un grupo de respuestas posibles dispuestas en las plantillas estándares que representan soluciones posibles a la pregunta de usuario. La arquitectura del Search Engine también tiene un investigador de la palabra clave para localizar otras respuestas posibles buscando en cualquier palabra clave vuelta del programa de análisis. Las respuestas vueltas de la unidad emparejadora de la pregunta y del investigador de la palabra clave se presentan al usuario para la confirmación en cuanto a la cual la respuesta representa lo más mejor posible las intenciones del usuario al incorporar la pregunta inicial de la búsqueda. La arquitectura del Search Engine registra las preguntas, las respuestas vueltas al usuario, y la regeneración de la confirmación del usuario en una base de datos del registro. El Search Engine tiene un analizador del registro para evaluar la base de datos del registro para espigar la información que mejora el funcionamiento del Search Engine en un cierto plazo entrenando al programa de análisis y a la unidad emparejadora de la pregunta.

 
Web www.patentalert.com

< Method and system for efficiently identifying differences between large files

< Multi-dimensional data structure caching

> Interactive formatting interface

> Data structure and method of storing a digital document

~ 00121