The present invention provides a document retrieval apparatus that performs full text retrieval search on the documents by using an index of relatively smaller capacity for not only Indo-European documents but also Japanese documents in which the breakpoints of words are not clearly articulated. Every word contained in documents with the redundancy eliminated is stored in an index along with the information concerning the adjacent words adjoining to the words in the documents. When retrieving, based on the retrieval search criteria containing plural words and the sequential order thereof, word search parts determine whether plural words stored in the index matches the retrieval search criteria to identify if a document matches the criteria. Also the sequence of words may be restored from the index to output the appropriate full text of document.

Присытствыющий вымысел обеспечивает прибор возвращения документа выполняют полный поиск возвращения текста на документах путем использование индекса относительно более малой емкости для not only индоевропейских документов но также японские документы в breakpoints слов ясно не артикулированы. Каждое слово, котор содержат в документах при исключенное дублирование хранится в индексе вместе с данными по смежные слова граничя к словам в документах. Когда retrieving, основанный на критери по поиска возвращения содержа плюральные слова и последовательный заказ thereof, части поиска слова обусловливает хранили ли плюральные слова в спичках индекса критеря по поиска возвращения, котор нужно определить если документ сопрягает критерии. Также последовательность слов может быть восстановлена от индекса для того чтобы вывести наружу соотвествующий полный текст документа.

 
Web www.patentalert.com

< (none)

< Document image search device and recording medium having document search program stored thereon

> Knowledge extraction system and method

> (none)

~ 00048