Document Indexing with a Concept Hierarchy Índice de Documentos con una Jerarquía de Conceptos
Document Indexing with a Concept Hierarchy Índice de Documentos con una Jerarquía de Conceptos
Date
2025
Authors
Leonado Reyes Cruz
Journal Title
Journal ISSN
Volume Title
Publisher
Leonardo Reyes Cruz
Abstract
Se considera la tarea de la selección de los conceptos que describen el contenido de un documento dado. Los conceptos se
eligen de un diccionario jerárquico grande (un tesauro, o bien una ontología). Se propone un método estadístico para crear
un índice de los documentos, guiado por tal diccionario. El método es robusto en cuanto a los errores en el diccionario, lo
que permite traducir tal diccionario semiautomáticamente en varios lenguajes. Se discute el problema del uso de los nodos
no terminales y especialmente de los nodos de alto nivel en la jerarquía. Se presentan los métodos para ponderación
automática de los nodos y vínculos en la jerarquía de la manera en que coincide con los criterios del sentido común. Se
discute la aplicación del método en el sistema Classifier.
Palabras Clave: Caracterización de Documentos, Comparación de Documentos, Ontología, Métodos Estadísticos
Description
Keywords
Citation
https://uaslpedu-my.sharepoint.com/:b:/g/personal/a345313_alumnos_uaslp_mx/EXW-suiMPxxHg8Sks4nxxToB8JFlZ48EG0XvwmnpwACb4w?e=5tJU3K