A document search device searches for a keyword in a recognition result obtained by character recognition performed on a document image. The keyword includes at least one first character, and a character code is assigned to each of the at least one first character. The recognition result includes at least one second character, and a character code and a partial area of the document image are assigned to each of the at least one second character. The document search device includes a first matching portion specification section for determining whether or not the recognition result includes at least one first matching portion which matches the keyword based on a comparison of the character codes, and for, when it is included, specifying the at least one first matching portion; a first portion specification section for determining whether or not a remaining part of the recognition result other than the at least one first matching portion includes at least one first portion which fulfills a prescribed first condition, and for, when it is include, specifying the at least first portion; and a second matching portion specification section for determining whether or not the at least one first portion includes at least one second matching portion which matches the keyword based on a comparison of a feature amount of the partial area with a feature amount of an image of at least one first character included in the keyword, and for, when it is included, specifying the at least one second matching portion. The prescribed first condition includes a condition that the at least one first portion is in the vicinity of a specific second character having a width smaller than a prescribed value.

Um dispositivo da busca do original procurara por um keyword em um resultado do recognition obtido pelo recognition de caráter executado em uma imagem do original. O keyword inclui ao menos um primeiro caráter, e um código de caráter é atribuído a cada um do ao menos um primeiro caráter. O resultado do recognition inclui ao menos um segundo caráter, e um código de caráter e uma área parcial da imagem do original são atribuídos a cada um do ao menos um segundo caráter. O dispositivo da busca do original inclui uma primeira seção de especificação combinando da parcela para determinar se ou não o resultado do recognition inclui ao menos uma primeira parcela combinando que combina o keyword baseado em uma comparação dos códigos de caráter, e para, quando é incluído, especificando a ao menos uma primeira parcela combinando; uma primeira seção de especificação da parcela para determinar se ou não uma parte restante do resultado do recognition à excepção da ao menos uma primeira parcela combinando inclui ao menos uma primeira parcela que cumpre uma primeira condição prescrita, e para, quando é inclui, especificando ao menos a primeira parcela; e uma segunda seção de especificação combinando da parcela para determinar se ou não a ao menos uma primeira parcela inclui ao menos uma parcela combinando do segundo que combina o keyword baseado em uma comparação de uma quantidade da característica da área parcial com uma quantidade da característica de uma imagem ao menos de um primeiro caráter incluído no keyword, e para, quando for incluído, especificando a ao menos uma parcela combinando do segundo. A primeira condição prescrita inclui uma condição que a ao menos uma primeira parcela está na vizinhança de um segundo caráter específico que tem uma largura menor do que um valor prescrito.

 
Web www.patentalert.com

< (none)

< Method and system for simulating a database table in response to a database query

> Document retrieval apparatus

> (none)

~ 00048