Join thousands of book lovers
Sign up to our newsletter and receive discounts and inspiration for your next reading experience.
By signing up, you agree to our Privacy Policy.You can, at any time, unsubscribe from our newsletters.
A Extração de Informação (EI) é o ramo da área de recuperação de informação (RI) que utiliza técnicas e algoritmos para identificar e coletar informações desejadas em documentos estruturados ou não, persistindo-as em um formato apropriado para consultas futuras. A utilização de Processamento de Linguagem Natural (PLN) revela-se benéfico ao processo de extração, principalmente quando se processam documentos sem estrutura e/ou padrão definido. Um framework que reúne dezenas de plug-ins que podem ajudar na tarefa de EI baseada em PLN é o conhecido GATE (General Architecture for Text Engineering). Neste sentido propõe-se o modulo RELPIE (Regular Expressions for Language Processing Information Extraction), contendo plug-ins para a extração a partir de texto livre. O módulo é original e integra plug-ins GATE baseados em expressões regulares (ER) e regras de produção (RP), que ficam totalmente separadas do sistema, visando modularidade na EI. Os resultados obtidos demonstram que a proposta apresenta bons níveis de extração e reconhecimento de entidades nomeadas (NER), cerca de 80%, em texto livre.
Sign up to our newsletter and receive discounts and inspiration for your next reading experience.
By signing up, you agree to our Privacy Policy.