Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://tede.mackenzie.br/jspui/handle/tede/3667
Tipo do documento: Dissertação
Título: Estudos sobre um modelo de representação distribuída de palavras no contexto de análise de estados emocionais
Autor: Silva, Isabela Ruiz Roque da 
Primeiro orientador: Silva, Leandro Nunes de Castro
Primeiro membro da banca: Silva, Leandro Augusto da
Segundo membro da banca: Pereira, André Luiz Vizine
Resumo: Emoções são importantes nas relações interpessoais e fazem parte do ser humano. Muitas pessoas podem expressar seus sentimentos ou emoções nas mídias sociais, como no Twitter e no Facebook. Muitas técnicas computacionais foram propostas para o estudo das emoções e a maior parte delas utiliza uma representação baseada em conjuntos de palavras (bag of words) para os documentos. Recentemente, novas abordagens, como o Word2Vec, capazes de gerar representações distribuídas de palavras, chamadas de vetores de palavras ou word vectors, surgiram e vêm sendo empregadas para o estudo sintático e semântico de documentos. Para contribuir com a pesquisa nas áreas de análise de estados emocionais a partir de dados de mídias sociais e numa melhor compreensão sobre o uso de modelos de representação distribuída de palavras, essa dissertação propõe investigar três hipóteses de pesquisa: os parâmetros do Word2Vec influenciam as representações distribuídas das palavras e, consequentemente, o desempenho dos classificadores de estados emocionais que usam essas representações; as representações distribuídas de palavras podem melhorar o desempenho de classificadores convencionais aplicados ao estudo de estados emocionais; e o agrupamento dos vetores de palavras geram grupos que carregam o contexto semântico dos estados emocionais. Os experimentos realizados mostraram pouca influência dos parâmetros do algoritmo no seu desempenho para esse problema específico. Também observamos que os vetores de palavras não podem ser aplicados diretamente no treinamento dos classificadores e o vetor resultante deteriorou muito o desempenho dos classificadores quando comparado ao modelo tradicional do tipo bag of words. Por fim, verificamos que o agrupamento dos vetores de palavras, embora gere grupos com significado semântico claro, não gera os grupos que refletem os estados emocionais.
Abstract: Emotions are important in interpersonal relationships and are part of the human being. Many people can express their feelings or emotions through social media, like Twitter and Facebook. Many computational techniques have been proposed for the study of emotions, and most use a bag-of-words representation for documents. Recently, new approaches, such as Word2Vec, ca-pable of generating distributed representations of words, called word vectors, have arisen and are being used for the syntactic and semantic study of documents. To contribute to the research in emotional states analysis from social media data and a better understanding of the use of distributed word representation models, this dissertation proposes to investigate three hypothe-ses: the Word2Vec parameters influence the distributed representations of words and, conse-quently, the performance of the emotional state classifiers that use these representations; the distributed representations of words can improve the performance of conventional classifiers applied to the study of emotional states; and clustering word vectors generate groups that carry the semantic context of emotional states. The experiments performed showed little influence of the algorithm parameters on its performance for this specific problem. We also observed that the word vectors could not be applied directly in the training of classifiers and the resulting vector greatly deteriorated the performance of the classifiers when compared to the traditional bag of words model. Finally, we found that the grouping of word vectors, while generating groups with clear semantic meaning, does not generate groups that reflect emotional states.
Palavras-chave: classificação de emoções
mineração de dados
redes neurais artificiais
análise de sensibilidade paramétrica
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
Idioma: por
País: Brasil
Instituição: Universidade Presbiteriana Mackenzie
Sigla da instituição: UPM
Departamento: Faculdade de Computação e Informática (FCI)
Programa: Engenharia Elétrica
Citação: SILVA, Isabela Ruiz Roque da. Estudos sobre um modelo de representação distribuída de palavras no contexto de análise de estados emocionais. 2018. 56 f. Dissertação( Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo.
Tipo de acesso: Acesso Aberto
Endereço da licença: http://creativecommons.org/licenses/by-nc-nd/4.0/
URI: http://tede.mackenzie.br/jspui/handle/tede/3667
Data de defesa: 7-Ago-2018
Aparece nas coleções:Mestrado - Engenharia Elétrica e Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ISABELA RUIZ ROQUE DA SILVA.pdfIsabela Ruiz Roque da Silva2.1 MBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Este item está licenciada sob uma Licença Creative Commons Creative Commons