Download PDFOpen PDF in browserIdentificação de Relevância Em Textos de Sistemas de Help Desk Usando Técnicas Clássicas de Aprendizado de MáquinaEasyChair Preprint 96058 pages•Date: January 20, 2023AbstractOs sistemas de Help Desk possuem uma rica base de informações, composta pelo histórico de atendimentos realizados, que pode e deve ser utilizada como base de consulta para atendimentos seguintes. Ferramentas comuns de busca, como buscas por palavras-chave, mostram-se inviáveis para busca em grandes datasets, além de poder trazer resultados não necessariamente relacionados ao problema. A proposta deste trabalho é investigar a capacidade de alguns algoritmos clássicos de classificação em encontrar a característica aqui definida como “relevância”: a característica de textos com algum conhecimento que possa ser reutilizado. A motivação é que os textos não relevantes possam ser removidos antecipadamente do dataset, permitindo que algoritmos complexos possam ser empregados em uma quantidade menor de informações. Nos testes realizados foram utilizados os classificadores Naive-Bayes, Adaptive Boosting, Random Forest, Stochastic Gradient Descent, Logistic Regression, Support Vector Machine e Light Gradient Boosting Machine. Os classificadores apresentaram acurácia abaixo de 0,8, indicando que, neste cenário, outras abordagens mais eficientes devem ser utilizadas. Keyphrases: Aprendizado de Máquina, Classificação, Processamento de Linguagem Natural, Sistemas de Help Desk
|