Logo artbmxmagazine.com

Mineração de dados

Índice:

Anonim

Algo que costuma ser pior do que não ter informação disponível é ter muita informação e não saber manejar. Nos últimos anos, a humanidade desenvolveu uma grande habilidade e capacidade de gerar e coletar dados, pois existem máquinas que podem processá-los com baixo custo de armazenamento.

Mesmo assim, dentro dessas enormes quantidades de dados, existe uma grande quantidade de informações ocultas que são de grande importância, mas que não podem ser acessadas por meio de técnicas clássicas de recuperação de informações.

Toda a descoberta desta informação é possível graças à mineração de dados ou Datamining, que entre outras características que veremos no desenvolvimento deste artigo é o uso de inteligência artificial que permite identificar padrões e relações nos dados permitindo criando modelos.

Durante o desenvolvimento deste artigo, será desenvolvida a temática de mineração de dados, quais são suas características, metodologia e suas principais áreas de aplicação.

Palavras chave:

  • DataminingData miningAnálise de informaçãoProcessamento de dadosBanco de dados

MINERAÇÃO DE DADOS

Geral

É curioso que na era em que vivemos atualmente, considerada a era da informação, pois graças a ela podemos descobrir rapidamente sobre eventos ao redor do mundo, os dados podem formar uma parede confusa e heterogênea.

A matéria-prima utilizada para a tomada de decisões nem sempre é a mais acessível, portanto é necessário sair e procurá-la e embora pareça simples não o é, pois é necessário extrair os dados seletivamente para obter um benefício económico.

Tudo isso é conhecido como mineração de dados, embora seja definido corretamente mais tarde, é como dizer que se os anões da Branca de Neve foram trabalhar para encontrar pedras preciosas, eles também tiveram que pegar as pás e picaretas adequadas para obtê-las Nesse caso, seria para obter as informações corretas.

O principal objetivo da mineração de dados é extrair a informação de um conjunto de dados, trabalhá-la e lapidá-la para poder transformá-la em uma estrutura que seja compreensível para uso posterior.

Organizações que usam data mining podem ver rapidamente o retorno de seu investimento, pois param de dar passos errados, uma aplicação é a detecção de hábitos de consumo em um supermercado. (Durán Mena, 2014)

O que é mineração de dados?

Aqui estão algumas definições de mineração de dados de vários autores:

  • Mineração de dados é o processo que permite detectar informações adicionais de grandes conjuntos de dados, pois usa uma análise matemática que permite deduzir os padrões e tendências existentes nos dados. (SQL Server, 2014) Data mining é aquele processo cuja finalidade é extrair, descobrir e armazenar certas informações que sejam relevantes de grandes bancos de dados, por meio de programas de busca e outros indicadores que tenham uma explicação e que possam ser descobertos aplicando essas ferramentas. (Larrieta & Santillán Gómez, 2007) Data mining, também conhecido como «data ou descoberta de conhecimento» e é o processo de analisar dados de diferentes pontos de vista e resumi-los em informações úteis. (Tecnologias de informação,2009) Datamining ou data mining é um conjunto de técnicas e tecnologias que permitem explorar grandes bases de dados, de forma automática ou semi-automática, a fim de encontrar padrões repetitivos, tendências ou regras que permitem explicar comportamentos de dados em um determinado contexto. (Sinnexus, 2007)

Aplicação de mineração de dados

(SQL Server, 2014) Os modelos de mineração de dados podem ser aplicados nos seguintes cenários:

  • Forecast: Permite calcular vendas e prever cargas ou tempo de inatividade do servidor Risco e probabilidade: Ajuda a escolher os melhores clientes para a correta distribuição do correio e atribui probabilidades de diagnóstico ou alguns outros resultados Recomendações: Utilizado para determinar produtos que podem ser vendidos juntos e geram algumas recomendações.Sequências de pesquisa: Analise itens que os clientes inseriram em um carrinho de compras e, assim, preveja possíveis eventos.Grupo: Separe clientes ou eventos em clusters específicos e, assim, analise ou preveja afinidades.

Principais características e objetivos da mineração de dados

(Vallejos, 2006) As características mais importantes da mineração de dados são:

  • Explore dados localizados profundamente em bancos de dados ou data warehouses, pois eles tendem a armazenar muitas informações ao longo do tempo. Em certos casos, esses bancos de dados ou data warehouses tornam-se mercados de dados ou são normalmente mantidos em Servidores de Internet ou Intranet O ambiente externo de mineração geralmente é o relacionamento servidor-cliente. Ferramentas de datamining ajudam a extrair minério de informações que estão enterradas em arquivos corporativos ou registros públicos. A mineração de dados produz alguns tipos de informação:
  • Associações Classificações Sequências Previsões Agrupamentos

Na mineração de dados, os dados são selecionados na esperança de que algumas hipóteses surjam deles e os dados são buscados para descrever ou indicar porque eles são do jeito que são.

Posteriormente, a hipótese é validada e, portanto, a mineração de dados deve apresentar uma abordagem exploratória, embora o uso de datamining para confirmar as hipóteses seja um pouco perigoso, uma vez que uma inferência um tanto válida é feita.

Datamining é uma tecnologia composta por etapas que integram diversas áreas, mas não deve ser confundida com software.

Atualmente existem algumas aplicações ou ferramentas de mineração de dados que são poderosas e que facilitam o desenvolvimento de projetos, embora geralmente sejam complementadas com outra ferramenta.

Estágios do processo de datamining

Embora a mineração de dados tenda a ser diferente um do outro, o processo comum de mineração de dados consiste em quatro etapas principais:

Determinação de objetivos

Esta primeira etapa trata da delimitação dos objetivos que o cliente pode desejar sob a orientação de um especialista em

datamining.

Reprocessamento de dados

Na segunda etapa, refere-se basicamente à seleção, limpeza, enriquecimento, redução e transformação de bancos de dados, esta etapa geralmente consome cerca de setenta por cento do tempo total de um projeto de datamining.

Determinação do modelo

Terceira etapa, nesta inicia-se a realização de uma análise estatística dos dados e posteriormente é visualizado de forma gráfica para se ter uma aproximação.

Dependendo dos objetivos traçados e das tarefas a executar, podem ser utilizados alguns algoritmos desenvolvidos em diferentes áreas da Inteligência Artificial.

Análise dos resultados

Fases do projeto de Datamining (Vallejos, 2006)

Na última etapa, os resultados obtidos são verificados e comparados com análises estatísticas e gráficos.

O cliente deve decidir se eles são novos e se fornecem novos conhecimentos que lhes permitem tomar decisões.

Aplicações de Uso

A cada ano, em diferentes congressos e workshops, se encontram pesquisadores com diferentes aplicações, principalmente nos Estados Unidos, a mineração de dados tem sido incorporada à vida de organizações, universidades, governos, hospitais e diversas empresas têm interesse em explorar suas bases De dados.

No governo

O FBI analisará bancos de dados comerciais para detectar terroristas.

Na empresa

  • Ele permite a detecção de fraude de cartão de crédito Descubra por que as pessoas abandonam uma empresa de telefonia móvel Identifique hábitos de compra em supermercados Preveja o tamanho da audiência de televisão

Na Universidade

Permite saber se recém-formados em uma universidade desenvolvem atividades profissionais relacionadas ao que estudaram.

Em investigações especiais

Desenvolvimento do projeto SKYCAT, que se baseia em técnicas de agrupamento e árvores de decisão para poder classificar objetos com alta confiabilidade.

Em clubes esportivos

As equipes da NBA usam aplicativos inteligentes para apoiar sua equipe de treinamento. (Vallejos, 2006)

conclusão

Datamining ou data mining, como vimos no desenvolvimento deste artigo, serve para cultivar a fidelidade do cliente, pois permite que ele ofereça algo que considere valioso, já que uma de suas características é identificar padrões de comportamento com certa tendência à desistência. Elimine com base nos dados dos clientes que já o fizeram, para que as organizações possam sempre estar um passo à frente e oferecer alguns incentivos para reter seus clientes.

Existem também muitas áreas de aplicação importantes para este tipo de análise de informação, tais como medicina, prevenção e controle de fraudes, investigação de atos que estão ligados ao terrorismo, engenharia e genética.

O pessoal da mineração de dados diz que são basicamente estatísticas misturadas com negócios, e argumentam que os métodos que usa e os tipos de problemas que pode enfrentar o tornam único e altamente relevante.

Em suma, a mineração de dados se apresenta como uma tecnologia que está surgindo com diversas vantagens é claro, como o ponto de encontro entre pesquisadores e empresários, além de economizar grandes quantias de dinheiro para a organização além de permitir a abertura de novos oportunidades de negócio. Além de trabalhar com datamining implica cuidar de tantos detalhes que no final permite tomar decisões com precisão.

Referências

  • Durán Mena, C. (6 de agosto de 2014). Forbes Mexico. Obtido em https://www.forbes.com.mx/mineria-de-datos-informacion-precisa-y-relevante/Larrieta, MI, & Santillán Gómez, AM (2007). EJournal UNAM. Recuperado em março de 2016, de Data Mining: Conceito, características, estrutura e aplicações: http://www.ejournal.unam.mx/rca/190/RCA19007.pdfRAE. (2014). Real academia espanhola. Obtido em http://dle.rae.es/srv/search? M = 30 & w = Sinnexus variegado. (2007). Business Intelligence Computação estratégica. Obtido em março de 2016, em: http://www.sinnexus.com/business_intelligence/datamining.aspxSQL Server. (2014). Microsoft. Obtido em https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx Tecnologia da Informação. (2009). Sistemas de Informação: Processamento de dados, planejamento e gestão de recursos.Recuperado em março de 2016, em http://www.tecnologias-informacion.com/mineria-de-datos.html Vallejos, SJ (2006). ExaUnne.edu. Recuperado em março de 2016, em

Variegado: Heterogêneo, reunido sem incerteza. (RAE, 2014)

Baixe o arquivo original

Mineração de dados