Esse vídeo demonstra como extrair trechos de texto de dentro de variáveis do tipo texto em um banco de dados usando o STATA, de modo a formar novas variáveis e reconhecer padrões.
São usadas duas funções: substring e regexm.
É uma introdução ao uso das expressões regulares para mineiração/manipulação de texto.
O banco de dados utilizado é o do SIM - Sistema de informação de Mortalidade do Ministério da Saúde
URL do vídeo: • Text mining no STATA
Link para o banco de dados (formato STATA 13) e para o do-file: www.dropbox.co...
Негізгі бет Text mining no STATA
Пікірлер