Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://tede.mackenzie.br/jspui/handle/tede/1437
Registro completo de metadados
Campo DCValorIdioma
dc.creatorAbilhoa, Willyan Danielpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/9259859626470172por
dc.contributor.advisor1Silva, Leandro Nunes de Castropt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2741458816539568por
dc.contributor.referee1Oliveira, Pedro Paulo Balbi dept_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9556738277476279por
dc.contributor.referee2Omar, Nizampt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2067336430076971por
dc.contributor.referee3Carvalho, Marco Antônio Garcia dept_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/6366443994619479por
dc.contributor.referee4França, Fabricio Olivetti dept_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/8788356220698686por
dc.date.accessioned2016-03-15T19:37:48Z-
dc.date.available2014-06-30pt_BR
dc.date.issued2014-02-05pt_BR
dc.identifier.citationABILHOA, Willyan Daniel. Um método para extração de palavras-chave de documentos representados em grafos. 2014. 87 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Presbiteriana Mackenzie, São Paulo, 2014.por
dc.identifier.urihttp://tede.mackenzie.br/jspui/handle/tede/1437-
dc.description.resumoO Twitter é um serviço de microblog que gera um grande volume de dados textuais. Todo esse conteúdo precisa ser explorado por meio de técnicas de mineração de textos, processamento de linguagem natural e recuperação de informação com o objetivo de extrair um conhecimento que seja útil de alguma forma ou em algum processo. Nesse contexto, a extração automática de palavras-chave é uma tarefa que pode ser usada para a indexação, sumarização e compreensão de documentos. Um passo fundamental nas técnicas de mineração de textos consiste em construir um modelo de representação de documentos. O modelo chamado mode-lo de espaço vetorial, VSM, é o mais conhecido e utilizado dentre essas técnicas. No entanto, algumas dificuldades e limitações do VSM, tais como escalabilidade e esparsidade, motivam a proposta de abordagens alternativas. O presente trabalho propõe o método TKG (Twitter Keyword Graph) de extração de palavras-chave de coleções de tweets que representa textos como grafos e aplica medidas de centralidade para encontrar vértices relevantes, correspondentes às palavras-chave. Para medir o desempenho da abordagem proposta, dois diferentes experimentos são realizados e comparações com TF-IDF e KEA são feitas, tendo classifica-ções humanas como referência. Os experimentos realizados mostraram que algumas variações do TKG são superiores a outras e também aos algoritmos usados para comparação.por
dc.description.abstractTwitter is a microblog service that generates a huge amount of textual content daily. All this content needs to be explored by means of techniques, such as text mining, natural language processing and information retrieval. In this context, the automatic keyword extraction is a task of great usefulness that can be applied to indexing, summarization and knowledge extrac-tion from texts. A fundamental step in text mining consists of building a text representation model. The model known as vector space model, VSM, is the most well-known and used among these techniques. However, some difficulties and limitations of VSM, such as scalabil-ity and sparsity, motivate the proposal of alternative approaches. This dissertation proposes a keyword extraction method, called TKG (Twitter Keyword Graph), for tweet collections that represents texts as graphs and applies centrality measures for finding the relevant vertices (keywords). To assess the performance of the proposed approach, two different sets of exper-iments are performed and comparisons with TF-IDF and KEA are made, having human clas-sifications as benchmarks. The experiments performed showed that some variations of TKG are invariably superior to others and to the algorithms used for comparisons.eng
dc.description.provenanceMade available in DSpace on 2016-03-15T19:37:48Z (GMT). No. of bitstreams: 1 Willyan Daniel Abilhoa.pdf: 1956528 bytes, checksum: 5d317e6fd19aebfc36180735bcf6c674 (MD5) Previous issue date: 2014-02-05eng
dc.description.sponsorshipFundação de Amparo a Pesquisa do Estado de São Paulopt_BR
dc.formatapplication/pdfpor
dc.thumbnail.urlhttp://tede.mackenzie.br/jspui/retrieve/3853/Willyan%20Daniel%20Abilhoa.pdf.jpg*
dc.languageporpor
dc.publisherUniversidade Presbiteriana Mackenziepor
dc.publisher.departmentEngenharia Elétricapor
dc.publisher.countryBRpor
dc.publisher.initialsUPMpor
dc.publisher.programEngenharia Elétricapor
dc.rightsAcesso Abertopor
dc.subjectmineração de textospor
dc.subjectrepresentação de textos em grafopor
dc.subjectextração de palavras-chavepor
dc.subjectmedidas de centralidadepor
dc.subjecttext miningeng
dc.subjecttext representation in graphseng
dc.subjectkeyword extractioneng
dc.subjectcentrality measureseng
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApor
dc.titleUm método para extração de palavras-chave de documentos representados em grafospor
dc.typeDissertaçãopor
Aparece nas coleções:Mestrado - Engenharia Elétrica e Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Willyan Daniel Abilhoa.pdf1.91 MBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.