b) Considerando o problema enfrentado pela empresa, explique como um algoritmo baseado em regras, como o algoritmo de Porter, poderia aproximar palavras com terminações diferentes, como “aprender”, “aprendizado” e “aprendendo”. c) Proponha uma solução para melhorar o mecanismo de busca da plataforma educacional, indicando como a radicalização poderia ser aplicada, qual limitação ela pode apresentar […]
a) Explique o que é radicalização (stemming) e qual é sua função no Processamento de Linguagem Natural. b) Considerando o problema enfrentado pela empresa, explique como um algoritmo baseado em regras, como o algoritmo de Porter, poderia aproximar palavras com terminações diferentes, como “aprender”, “aprendizado” e “aprendendo”. c) Proponha uma solução para melhorar o […]
Seu desafio é apresentar uma proposta inicial para a equipe de desenvolvimento, explicando como a radicalização poderia ajudar a melhorar o mecanismo de busca da plataforma. Com base nesse cenário, responda: a) Explique o que é radicalização (stemming) e qual é sua função no Processamento de Linguagem Natural. b) Considerando o problema enfrentado pela […]
Ao analisar o sistema, você percebe que ele realiza apenas um pré-processamento simples: transforma os textos em letras minúsculas, remove pontuação e separa as palavras. No entanto, ele ainda não utiliza técnicas de normalização textual, como radicalização ou lematização. Com isso, palavras relacionadas acabam sendo tratadas como termos totalmente diferentes, prejudicando a qualidade da […]
Durante os testes, a equipe percebeu um problema: quando o estudante pesquisa a palavra “aprendizagem”, o sistema não encontra textos que usam termos como “aprender”, “aprendizado” ou “aprendendo”. O mesmo ocorre com a palavra “classificação”, que não recupera documentos com termos como “classificar”, “classificado” ou “classificando”. Ao analisar o sistema, você percebe que ele […]
Imagine que você foi contratado como analista de dados por uma empresa de tecnologia educacional que está desenvolvendo uma plataforma de apoio à leitura acadêmica. Essa plataforma permite que estudantes pesquisem artigos, materiais didáticos e conceitos importantes em uma base de textos. Durante os testes, a equipe percebeu um problema: quando o estudante pesquisa […]
Entre os algoritmos de radicalização mais conhecidos está o algoritmo de Porter, criado originalmente para a língua inglesa e amplamente utilizado em tarefas de PLN. Esse algoritmo utiliza regras previamente definidas para remover sufixos e reduzir palavras a formas mais simples. Seu funcionamento ocorre em fases, cada uma voltada ao tratamento de certos tipos […]
Uma dessas etapas é a radicalização, também chamada de stemming. Essa técnica tem como objetivo reduzir palavras flexionadas ou derivadas a uma forma mais simples, aproximada de seu radical. Por exemplo, palavras como “estudar”, “estudando”, “estudado” e “estudos” podem ser aproximadas de uma mesma base, como “estud”. Isso permite que um sistema reconheça relações […]
O Processamento de Linguagem Natural, conhecido pela sigla PLN, é uma área da Inteligência Artificial dedicada ao desenvolvimento de métodos, técnicas e sistemas capazes de permitir que computadores interpretem, processem e produzam linguagem humana. Essa área está presente em mecanismos de busca, corretores ortográficos, tradutores automáticos, chatbots, sistemas de recomendação, análise de sentimentos, classificação […]
“Algoritmos de radicalização (stemming) baseados em regras, como o algoritmo de radicalização de Porter, são amplamente utilizados no processamento de linguagem natural para reduzir as palavras às respectivas raízes ou formas básicas. O algoritmo de radicalização de Porter utiliza um conjunto de regras predefinidas e métodos heurísticos para remover sufixos e transformar palavras em […]
