Method for transforming words to unique numerical representation

   
   

Multiple words in a text are transformed to unique numerical representations for text mining applications. A web server receives the text, including multiple words in a natural language. A key-word extractor extracts one or more key-words from the received words. A morphologizer morphologizes the extracted key-words based on similarities of fundamental characteristics in the extracted key-words. An analyzer transforms each of the morphologized words to a unique numerical representation such that the transformed unique numerical representation does not result in multiple similar numerical representations.

De veelvoudige woorden in een tekst worden omgezet aan unieke numerieke vertegenwoordiging voor de toepassingen van de tekstmijnbouw. Een Webserver ontvangt de tekst, met inbegrip van veelvoudige woorden in een natuurlijke taal. Een sleutelwoordtrekker haalt één of meerdere sleutelwoorden uit de ontvangen woorden. Een morphologizer morphologizes de gehaalde sleutelwoorden die op gelijkenissen van fundamentele kenmerken in de gehaalde sleutelwoorden worden gebaseerd. Een analysator zet elk van om morphologized woorden aan een unieke numerieke vertegenwoordiging dusdanig dat de omgezette unieke numerieke vertegenwoordiging niet in veelvoudige gelijkaardige numerieke vertegenwoordiging resulteert.

 
Web www.patentalert.com

< Method, system, and program product for permission to access software

< System and method for managing file system extended attributes

> Systems, methods and apparatus for creating stable disk images

> System and method for dynamically evaluating an electronic commerce business model through click stream analysis

~ 00159