CURSO: BI – Inteligência em Negócios

 

 

 

INSTRUTOR:

Rubens de Azevedo Ramos

 

 

 

 

 

 

OBJETIVOS DO CURSO:

 

Qualificar gerentes para dominar a manipulação e guarda de dados em sistemas de escritório, criar fórmulas matemáticas e estatísticas em planilhas eletrônicas e transformar informações de clientes e operações, retirados de relatórios da base de dados do negócio, em conhecimento necessário para alavancar negócios e satisfazer os correntistas.

 

1. Disponibilizar informações do Sistema de Informações Gerenciais – DW, que facilitem o entendimento das necessidades dos diversos perfis de clientes, para facilitar a venda de produtos e serviços do negócio;

2. Manipular dados de clientes e operações em planilhas, classificando, estruturando e minerando informações necessárias para identificar negócios potenciais, usando o conhecimento tácito com as ferramentas da informática;

3. Criar modelos estatísticos capazes de estimar tendências, direcionar ações estratégicas e facilitar a tomada de decisão, utilizando variáveis dependentes e independentes;

4. Identificar lacunas de negócios e clientes potencias melhorando a competitividade e efetividade.

 

·      A Tecnologia de Informação já chegou aqui.

·      Utilize a Intranet e o Correio eletrônico.

 

 

Algumas empresas construíram vários negócios a partir de habilidades de coletar, analisar e agir com os seus dados. Podemos aprender o que eles fazem. Grandes empresas tem investido nos seus criadores de rentabilidade e reputação. Esses anunciados e desejados aglomerado de dados são aplicados em caminhos que elevam a expectativa do cliente e aperfeiçoa operações em níveis sem precedentes. Eles transformam as ferramentas tecnológicas em armas de estratégia. (Davenport,  Competing on Analytics, 2007).

 

A utilização produtiva de sistemas de informação depende não somente de hardware e software, que são potentes ferramentas para tratamento de dados e informações, mas da qualidade das informações e da inteligência dos tomadores de decisão que realizarão os negócios e desenvolverão o conhecimento produtivo. Para os gerentes e especialistas em negócios os sistemas de informação são difíceis de ser construídos e os gestores tecnológicos não compreendem claramente esses profissionais. Tais sistemas acabam por diminuir o controle e a criatividade pessoal. (Laudon, Laudon, p. 290, 2001).

 

Diante de um mercado turbulento, globalizado e altamente competitivo, as organizações necessitam de informações oportunas e conhecimentos personalizados para auxiliar seus processos de tomada de decisão e gestão de negócios, além da necessidade de adequação das operações cotidianas às necessidades do ambiente em que estão inseridas. A Tecnologia da Informação (TI) assume um papel relevante, quando bem estruturada e planejada, facilitando a geração de cenários decisórios, agregando valor aos produtos/serviços e auxiliando a promoção de inteligências competitivas.  A TI deve, também, atender as aspirações das atividades operacionais, gerenciais e estratégicas, incluindo os processos produtivos, comerciais e financeiros, contribuindo para o alcance dos objetivos e metas empresariais. (Rezende, p. 17, 2002).

 

O BI – (Business Intelligence) pode ser entendido como o processo de desenvolvimento de estruturas especiais de armazenamento de informações (Data Warehouse - DW), com o objetivo de se montar uma base de recursos informacionais, capaz de sustentar a camada de inteligência da empresa e possível de serem aplicados a seus negócios, como elementos diferenciais e competitivos” (Barbieri, 2001, p.48). Assim, o conceito de BI está relacionado ao apoio e subsídio aos processos de tomada de decisão baseados em dados trabalhados especificamente para a busca de vantagens competitivas.

ÍNDICE

Data Warehouse / Data Mart – Armazéns de Dados........... 4

Serviço......................................................................................................... 6

CRM................................................................................................................. 7

Modelo de Excelência da Gestão............................................... 9

Estatística............................................................................................... 10

FUNÇÃO MÉDIA.............................................................................................................. 11

FUNÇÃO DESV.PAD...................................................................................................... 13

Regressão e Correlação.................................................................. 14

CÁLCULO DA REGRESSÃO........................................................................................ 16


 Data Warehouse / Data Mart – Armazéns de Dados

http://sig.brb.com.br/apresentacoes/O%20Data%20Warehouse.pdf

Entre os vários benefícios decorrentes da implantação de um Sistema de Informações Gerenciais em uma empresa, podemos destacar os seguintes:

*   Informações unificadas - " Verdade Única ";

*   Maior agilidade e independência na extração de informações para os usuários ;

*   Acesso à informação democratizado;

*   Ampliação da capacidade de análise;

*   Suporte à tomada de decisão;

*   Disponibilização de informações históricas;

*   Reduzir as solicitações para os sistema legados.

Pode-se dizer que um DW é um conjunto de técnicas e de banco de dados com informações coletas dos sistemas operacionais das empresas e de outras fontes (planilhas eletrônicas, Internet etc), tendo como foco principal suportar as funções dos Sistemas de Apoio à Decisão. O Data Warehouse dará subsídio de informações aos gerentes e diretores da empresas para a tomada de decisão.

Segundo W.H.Inmon (um dos "pais" dos conceitos de DW), um data warehouse é uma coleção de dados orientada por assunto, integrada, variante no tempo, e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão.

Enquanto todos os sistemas transacionais estão voltados para processos e aplicações específicas, os DWs objetivam assuntos ( conjunto de informações trabalhadas por determinada área estratégica de uma empresa).

Através da integração que será padronizado uma representação única para os dados de todos os sistemas que formarão a base de dados do DW. Significa a uniformização dos dados e dos conceitos, ou seja:

Uniformização dos dados: se o sistema A trata sexo do cliente como M e F e o sistema B trata sexo como O e 1, para a carga do Data Warehouse, será feita a padronização dos dados, ou seja, sexo será tratado como M e F para todos os sistemas.

Como a informação passa a ser de uso corporativo, os conceitos ficam uniformes na organização, por exemplo, se rentabilidade tem um conceito para a área X e outro para a área Y, deve-se discutir qual conceito é o utilizado pela área estratégica e tática para ser utilizado por todas as áreas.

Segundo Inmon, os Data Warehouses são variáveis em relação ao tempo, isso nada mais é do que manter o histórico dos dados durante um período de tempo muito superior ao dos sistemas transacionais.

No DW existem somente duas operações, a carga e as consultas dos dados, podendo o dado permancer armazenado por anos, ficando a definição deste tempo de acordo com a necessidade da organização/área.

A diferença entre Data Mart e Data Warehouse é apenas com relação ao tamanho e ao escopo do problema a ser resolvido. Enquanto um Data Mart foca em um problema departamental ou local, um Data Warehouse envolve o esforço de toda a companhia para que o suporte à decisões atue em todos os níveis da organização.

Algumas organizações são atraídas aos Data Marts não apenas por causa do custo mais baixo e um tempo menor de implementação, mas também por causa dos correntes avanços tecnológicos. São elas que fornecem um SAD (Sistema de Apoio a Decisão) customizado para grupos pequenos de tal modo que um sistema centralizado pode não estar apto a fornecer. Data marts podem servir como veículo de teste para companhias que desejam explorar os benefícios do data warehouse.

Existem duas maneiras distintas de criação de data marts: top-down e botton-up.

 

Top-down: é quando a empresa cria um DW e depois parte para a segmentação, ou seja, divide o DW em áreas menores gerando assim pequenos bancos orientados por assuntos departamentalizados.

 

Botton-up: é quando a situação é inversa. A empresa por desconhecer a tecnologia, prefere primeiro criar um banco de dados para somente uma área. Com isso os custos são bem inferiores de que um projeto de DW completo. A partir da visualização dos primeiros resultados parte para outra área e assim sucessivamente até resultar num Data Warehouse completo.

Data Mining (ou mineração de dados) utiliza técnicas estatísticas e de aprendizado de máquinas (redes neurais) para construir modelos capazes de predizer o comportamento de clientes. Hoje em dia, a tecnologia consegue automatizar o processo de mineração, integrá-lo ao data warehouse e apresentá-lo de forma relevante aos seus usuários.

 

Diferentes técnicas existem para analisar os dados dos clientes. Há técnicas convencionais, como OLAP (On-Line Analytical Processing), ferramentas de consulta (query) e estatística, e novas técnicas como data mining. O valor de data mining pode ser melhor compreendido se comparado a técnicas convencionais. O Data mining difere de técnicas estatísticas porque, ao invés de verificar padrões hipotéticos, utiliza os próprios dados para descobrir tais padrões.

 

Bases de dados armazenam conhecimento que podem nos auxiliar a melhorar nossos negócios. Técnicas tradicionais permitem a verificação de hipóteses. Aproximadamente 5% de todas as relações podem ser encontradas por este método. Data mining pode descobrir outras relações anteriormente desconhecidas: os 95% restantes. Em outras palavras, você pode dizer que técnicas convencionais "falam" à base de dados, enquanto data mining "ouve" a base de dados. Se você não fizer uma pergunta específica, nunca terá a resposta. Data mining explora as bases de dados através de dezenas de centenas de pontos de vista diferentes. Toda a informação escondida relacionada ao comportamento dos clientes será mapeada e enfatizada.

 

Para o sucesso de um projeto de Data Mining é essencial que os usuários tenham capacitação no uso da técnica e da ferramenta utilizada. São eles que criarão modelos, formularão e testarão hipóteses ou agirão sobre relacionamentos recém descobertos.

O OLAP proporciona as condições de análise de dados on-line necessárias para responder às possíveis torrentes de perguntas dos analistas, gerentes e executivos

 

As ferramentas OLAP são as aplicações que os usuários finais têm acesso para explorarem os dados de suas bases e construir os relatórios capazes de responder a suas questões gerenciais. Elas surgiram juntamente com os sistemas de apoio a decisão para fazerem a consulta e análise dos dados contidos nos Data Warehouses e Data Marts. A funcionalidade de uma ferramenta OLAP é caracterizada pela análise multi-dimensional dinâmica dos dados, apoiando o usuário final nas suas atividades, tais como:

*   "Mostre-me o que é importante." (Exception Reporting)

*   "Deixe-me ver os detalhes." (Drill Down)

*   "Deixe-me ver informações mais consolidadas." (Drill Up)

*   "Deixe ver outros dados ou mude meu ponto de vista." (Drill Across)

*   "Deixe-me ver os melhores e os piores." (Ranking)

*   "Deixe-me comparar com anos anteriores." (Análise Comparativa)

 A Ferramenta OLAP utilizada pelo BRB para a Base Gerencial é a BusinessObjects que vai abrir um mundo de possibilidades que ainda não existem.

 

A etapa de ETL (Extract, Transform, Load) é uma das mais críticas de um projeto de DW, pois uma informação carregada erroneamente trará conseqüências imprevisíveis nas fases posteriores. O objetivo desta fase é fazer a integração de informações de fontes múltiplas e complexas. Basicamente, divide-se esta etapa em três passos: extração, transformação e carga dos dados. Embora tenhamos hoje em dia ferramentas que auxiliam na execução do trabalho, ainda assim é um processo trabalhoso, complexo e também muito detalhado.

 

A ferramenta utilizada pelo BRB é a Informatica PowerCenter.

"Modelagem Dimensional" é um nome novo para uma técnica antiga usada para criar bancos de dados simples e compreensíveis. Esta técnica possibilita mapear modelos dimensionais de negócios que podem ser facilmente entendidos e navegados pelo usuário final. Estes modelos são amplamente explorados pelos programas de recuperação de informações, ferramentas OLAP, através de uma interface com o usuário simples e amigável.

A Modelagem Dimensional permite-nos visualizar dados. A habilidade de visualizar algo tão abstrato quanto um conjunto de dados de forma concreta e tangível é o segredo da compreensibilidade.

A Base de Informações Gerenciais é o local em que as pessoas podem acessar seus dados. As metas fundamentais de um Sistema de Informações Gerenciais podem ser desenvolvidas andando-se pelos corredores de uma organização de grande porte e ouvindo as conversas nas gerências. Os temas que se repetem em todos os diálogos são:

"Possuímos montanhas de dados nesta empresa, mas não conseguimos acessá-los."

" Nada deixa o chefe mais enfurecido do que duas pessoas apresentando o mesmo resultado de negócio, mas com números diferentes."

" Queremos acessar os dados de todas as formas."

" Mostre-me apenas o que é importante."

Essas preocupações são tão universais, que determinam as necessidades fundamentais de um Sistema de Informações Gerenciais.

Esses problemas são transformados em oportunidades e especificados com os seguintes requisitos:

*   A Base de Informações Gerenciais fornece acesso a dados corporativos ou organizacionais;

*   Os dados da Base de Informações Gerenciais são consistentes;

*   Os dados na Base de Informações Gerenciais podem ser separados e combinados usando-se qualquer medição possível do negócio;

*   O Sistema de Informações Gerenciais não consiste apenas em dados, mas também em um conjunto de ferramentas para consultar, analisar e apresentar informações;

*   A Base de Informações Gerenciais é o local em que publicamos dados confiáveis.

A qualidade dos dados na Base de Informações Gerenciais impulsiona a reengenharia de negócios.

 

Serviço

Serviço: atividade ou conjunto de atividades, mais ou menos intangíveis que ocorrem com uma interação entre o Cliente e o funcionário da empresa prestadora de serviço.

Fatores que propiciaram o aumento da demanda por serviços: desejo de melhor qualidade de vida; mais tempo para lazer; urbanização; mudanças demográficas; mudanças socioeconômicas; sofisticação dos consumidores; mudanças tecnológicas e aumento da expectativa de vida.

Tipos de Serviços: um bem tangível acompanhado de serviços; um serviço principal acompanhando bens e serviços secundários e um serviço.

Características dos serviços: Intangibilidade, Perecibilidade, Inseparabilidade e Variabilidade.

Produtos: Tangíveis; homogêneos; produção e distribuição separadas do consumo; objeto; o consumidor não participa da produção e transfere a propriedade.

Serviços: Intangíveis; heterogêneos; produção, distribuição e consumo; simultâneos; desempenho; valor central produzido; interação e percepção; o consumidor participa da produção e não transfere a propriedade.

Composição de serviços: embalagem (uniforme dos empregados, intensidade luminosa e temperatura); design (procedimentos – rotina seguida, conjunto de  Etapas, decoração tanto de ambiente quanto do serviço e relatórios); marca (logomarca e aquilo que ela passa) e preço (ambiente, estratégia e posicionamento).

Planejamento estratégico em serviço: planejar estrategicamente, analisar desenhar um serviço, um ambiente, formar condições para a tomada de decisões. Conceito de serviços associado ao design e embalagem.

Barreiras competitivas: Tecnologia; intensidade de capital necessário; regulamentação governamental; economia de escala; acesso aos canais de distribuição e Transferência de custos operacionais.

Objetivos das estratégias em serviços: Tornar o serviço tangível e sincronizar provisão e demanda.

Qualidade em serviços: Percepção e Expectativa – diferença entre o serviço oferecido e o que o cliente espera (qualidade percebida – julgamento do consumidor; qualidade objetiva – comparação de expectativas com a percepção do desempenho).

Determinantes da qualidade em serviços: acessibilidade; comunicação; competência; cortesia; credibilidade; confiabilidade; responsividade; segurança; tangibilidade e conhecimento do cliente.

Estratégias em serviços: 1) como a empresa se estrutura. 2) quais os canais disponibilizados 3) qual a estratégia segmentar do mercado, qual a base e o que diferencia a empresa no mercado. 4) precificação. 5) gerenciamento do cliente. 6) perfil da força de trabalho. 7) seus pontos de atendimento.

Tríade dos serviços: Empresa de serviço; pessoal da linha de frente; cliente.

Estágio de excelência nos serviços: estágio 1 (satisfazer elementos essenciais do serviço) estágio 2 (mover-se na direção da excelência operacional dos processos); estágio 3 (enfatizar os processos de entrega aos clientes); estágio 4 (alinhar processos internos em torno das expectativas e da satisfação dos clientes).

 

CRM

Quando sua empresa passa das fontes de insatisfação dos clientes para fontes de aprovação é ótimo. Não se trata de defender que as pessoas se limitem ao básico; comece com o básico, ou seja, com o que importa para o cliente. Depois de conseguir isso, de contar com uma execução correta e de ouvir os consumidores, você terá um senso bem mais apurado para identificar e oferecer o que representa mais valor ao cliente.

 

CRM (Customer Relationship Management / Gerenciamento de relacionamento com clientes), também conhecido como marketing 1 para 1, ou marketing de relacionamento, isto é, diagnóstico, planejamento e integração de soluções voltadas a administração do relacionamento com o cliente. Ele é desenvolvido como o elemento principal da estratégia corporativa de muitas organizações. CRM, também conhecido por outros termos como marketing de relacionamento e gerenciamento de clientes, preocupa-se com a criação, desenvolvimento e melhoria dos relacionamentos individualizados com clientes cuidadosamente selecionados e grupos de clientes, resultando em uma maximização da retenção dos clientes.

É uma estratégia de negócios voltada para o entendimento e antecipação das necessidades dos clientes atuais e potenciais. A função do CRM é captar dados de clientes, consolidá-los em um banco de dados centralizado, analisá-los e distribuí-los para os gestores estratégicos realizarem ações mercadológicas junto aos clientes.

Benefícios do gerenciamento do relacionamento com clientes:

 

 

 

 

Modelo de Excelência da Gestão

 

 

A figura representativa do Modelo de Excelência da Gestão® simboliza a organização, considerada um sistema orgânico e adaptável, que interage com o ambiente externo. Sugere que os elementos do Modelo, imersos num ambiente de Informações e Conhecimento, relacionam-se de forma harmônica e integrada, voltados para a geração de Resultados. Embora o desenho admita diferentes interpretações, a que melhor descreve o Modelo utiliza o conceito de aprendizado, segundo o ciclo de PDCL (Plan, Do, Check, Learn), como descrito a seguir:

A sobrevivência e o sucesso de uma organização estão diretamente relacionados à sua capacidade de atender às necessidades e expectativas de seus Clientes, as quais devem ser identificadas, entendidas e utilizadas para que os produtos possam ser desenvolvidos, criando o valor necessário para conquistar e retê-los. Por outro lado, para que haja continuidade em suas operações, a organização também deve identificar, entender e satisfazer as necessidades e  expectativas da Sociedade e das comunidades com as quais interage de forma ética – indo além do que obriga as leis e preservando os ecossistemas –, contribuindo, desta forma, para o desenvolvimento das mesmas. A Liderança, de posse de todas essas informações, estabelece os princípios da organização e pratica e vivencia os fundamentos da excelência, impulsionando, com seu exemplo, a cultura da excelência na organização. Os líderes, principais responsáveis pela obtenção de resultados que assegurem a satisfação de todas as partes interessadas e a perpetuidade da organização, analisam o desempenho da mesma e executam, sempre que necessário, as ações requeridas, consolidando o aprendizado organizacional. As Estratégias são formuladas pelos líderes para direcionar a organização e o seu desempenho, e para determinar sua posição competitiva. São estabelecidas metas que consideram as projeções da demanda e o desempenho projetado dos concorrentes. As estratégias são desdobradas em todos os níveis da organização em Planos de ação, de curto e longo prazo. Recursos adequados são alocados para assegurar a implementação das estratégias. As estratégias, as metas e os planos são comunicados para as pessoas da força de trabalho e, quando pertinente, para as demais partes interessadas. A organização avalia permanentemente a implementação das estratégias e monitora os respectivos planos e responde rapidamente às mudanças nos ambientes interno e externo Até este momento, considerando os quatro critérios apresentados, tem-se a etapa de Planejamento (P) do ciclo PDCL da organização. As Pessoas que compõem a força de trabalho devem estar capacitadas e satisfeitas, atuando em um ambiente propício à consolidação da cultura da excelência, para executar e gerenciar adequadamente os Processos, criando valor para os clientes a fim de aperfeiçoar o relacionamento com os fornecedores. A organização planeja e controla os seus custos e investimentos. Os riscos financeiros são quantificados e monitorados. Conclui-se, neste momento, a etapa referente à Execução (D) do PDCL. Para efetivar a etapa do controle (C), são mensurados os Resultados em relação a: situação econômico-financeira, clientes e mercado, pessoas, sociedade, processos principais do negócio e processos de apoio, e fornecedores. Os efeitos gerados pela implementação sinérgica das práticas de gestão e pela dinâmica externa à organização podem ser comparados às metas estabelecidas para eventuais correções de rumo ou reforços das ações implementadas. Conclui-se, neste momento, a etapa referente a Controle (C) do PDCL. Esses resultados, em forma de Informações e Conhecimento, retornam a toda a organização, para que esta possa executar as ações e buscar o aprendizado organizacional. Essas informações representam a inteligência da organização, viabilizando a análise do desempenho e a execução das ações necessárias, em todos os níveis. A figura enfatiza as informações e o conhecimento como elementos que permitem a inter-relação de todos os critérios e, portanto, entre todos os elementos que constituem a organização. A gestão das informações e dos ativos intangíveis é um elemento essencial à jornada em busca da excelência. Conclui-se, neste momento, a etapa referente à Aprendizado (L) do PDCL. Os oito critérios de excelência estão subdivididos em 24 itens, cada um possuindo requisitos específicos e uma pontuação máxima. Destes, 18 são itens de processos gerenciais e seis de resultados organizacionais.

 

Estatística

É uma fotografia do comportamento dos dados. É uma metodologia, ou conjunto de técnicas que utiliza a coleta de dados, sua classificação, sua apresentação ou representação, sua análise e sua interpretação visando a utilização dentro de um processo decisório.

Estatística Descritiva: É a parte da estatística que procura descrever e analisar em certo grupo de observações, normalmente denominado de amostra, procurando expressar estas observações através de medidas e formas de representação (tabelas, gráficos, curvas, etc.). É também denominada Estatística Dedutiva;

Diagnóstico - Perguntas a serem respondidas (como?)...

População ou Universo Estatístico - É qualquer conjunto que reúna TODOS os elementos que tenham pelo menos uma característica comum, objeto de estudo. Pode ser finita ou infinita.

Amostra - É uma parte da população.

Dados estatísticos - Quanto a sua organização: Brutos: não são numericamente organizados; Rol: conjunto de dados estatísticos organizados em ordem crescente ou decrescente.

Freqüência Simples Absoluta - É o número de vezes em que um dado se repete na amostra.

Amplitude Total - É a diferença entre o maior e o menor valor da amostra.

Média Aritmética Simples - somatório dos dados pela quantidade de dados.

 

 

FUNÇÃO MÉDIA

 

 

 

Objetivo: calcular a média aritmética simples.

 

Fórmula:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Aqui informe as células onde estão os números para os quais você quer calcular a média aritmética (você pode selecionar até 30 argumentos, cada argumento é um grupo de seleção).

 

Caso você tenha mais do que 30 argumentos, utilize mais um quadro para informar onde eles estão, e assim sucessivamente.

 


 

Repare que antes mesmo de você clicar em OK, neste espaço o excel já mostrará qual é o resultado da função (isto acontece em praticamente todas as funções).

 

Mediana - Elemento central de uma série ordenada. É também uma Separatriz. Obs.: quando os dados forem par, devemos somar os valores centrais, calcular a média e dividir por dois.

Quartis, Decis e Percentis - São separatrizes que dividem o conjunto de valores ou distribuição em 4 partes iguais, 10 partes iguais e 100 partes iguais, respectivamente. Os QUARTIS são 3 valores numéricos que segmentam uma base de dados ordenados em 4 partes, ficando cada uma delas com 25% dos dados originais. A Mediana é o 2º. Quartil.

Variância: medida de proximidade dos dados. É uma medida do espalhamento da distribuição ao redor da média, e é calculada, primeiro pela soma dos desvios quadrados da média, e dividindo-a pelo número de observações.

Fórmula:

 

Desvio padrão - Percentual de variabilidade em relação à média. Para verificar se todos os dados da média variam muito ou pouco. Quanto mais próximo de zero, mais representativa será a média. Até 15 ou 20%: tolera-se a variabilidade. Podemos dar sugestões, fazer apontamentos; Acima de 30 ou 35% a variabilidade é alta e está não retrata adequadamente a realidade, pois neste caso haverá maiores possibilidades e indefinições. É chamada de zona de incerteza. Ponto de Equilíbrio: ± 3 desvios da média (Chebyshev). “Na pior das hipóteses, 89% da média estará dentro. 11% pode ser atípica ou discrepante”.

 

 

 

 

 

FUNÇÃO DESV.PAD

 

 

Objetivo: calcular o desvio-padrão (S) dos dados de uma amostra.

 

Fórmula:

 

Aqui informe as células onde estão os números para os quais você quer calcular o desvio-padrão amostral (você pode selecionar até 30 argumentos, cada argumento é um grupo de seleção).

 

 


Caso você tenha mais do que 30 argumentos, utilize mais um quadro para informar onde eles estão, e assim sucessivamente.

 


 

 

Análise descritiva – é uma análise de natureza estatística que busca descrever e explorar. É de natureza exploratória. O que fazer com pontos atípicos?  – Identificar ou localizar os pontos, aí então, isolar da pesquisa e buscar justificá-los.  A análise descritiva  de uma variável quantitativa faz uma "fotografia" que retrate o comportamento da variável sob investigação.

Coeficiente de variação é a melhor medida descritiva de variabilidade dos dados:

CV = DP / média

Com 5 ou 6% de coeficiente de variação, sem ponto de discrepância. Esta série em tese é homogênea e é uma medida representativa. Quando passa de 30% a variabilidade pode ser considerada alta. Então, com base nos parâmetros estatísticos estabelecidos para avaliação do CV pode-se afirmar que a média não é representativa da base de dados, ou seja, a base de dados não é suficientemente homogênea.

Diagnóstico de pontos atípicos ou discrepantes - Qual a motivação pra se investigar pontos atípicos? A atipicidade pode indicar algum problema. Limite superior = média + 3DP; Limite inferior = média - 3DP – Corresponde a 89% da amostra, conforme Chebyshev.

Gráfico é para ajudar na visualização do fenômeno. Fazer um gráfico de freqüências pode ajudar na visualização. O gráfico de freqüências mostra os picos e caracterizam uma tendência, ciclos perfil. Quando você tem uma série de dados temporal (anos, meses, semana, dias...) o melhor gráfico é o gráfico de freqüências. Ex. receita semanal oriunda da venda de determinado produto. Gráfico de linhas é o melhor gráfico para a visualização, por exemplo, da cotação do dólar ou quantidade de atendimentos por dias.

 

Regressão e Correlação

Segundo o dicionário Aurélio, correlação significa: relação mútua entre dois termos, qualidade de correlativo, correspondência. Correlacionar significa: estabelecer relação ou correlação entre; ter correlação. Enquanto que a palavra regressão significa: ato ou efeito de regressar, de voltar, retorno, regresso; dependência funcional entre duas ou mais variáveis aleatórias. A palavra regredir significa ir em marcha regressiva, retroceder.

Foi Francis Galton (1822-1911), primo de Charles Darwin, quem usou pela primeira vez esses termos, cujo trabalho influenciou a Estatística e a Psicologia. Galton publicou o livro Gênio Hereditário, em 1869, onde aplicou conceitos estatísticos a problemas da hereditariedade. Galton ficou impressionado com a distribuição normal aplicada a área de biologia por Quetelet, que mostrara no livro “O homem Médio”, que a estatura de dez mil sujeitos seguiam uma distribuição normal, ou seja, a maioria dos sujeitos tinham suas estaturas em torno da média e que um número, cada vez menor, vai sendo encontrado à medida que se afasta da média. O primeiro relato onde Galton usou o termo “co-relações” foi em 1888.

 

 As técnicas modernas de determinação da validade e da confiabilidade de testes, bem como os métodos da análise fatorial são resultados diretos da descoberta, por Galton, da correlação, produzida quando ele observou que as características tendem a regredir na direção da média (Scultz e Sschultz, 1981).

 

Galton cunhou o termo regressão, quando observou que filhos de homens altos, não são, em média, tão altos quanto os pais, enquanto que os filhos de homens muito baixos são, em média, mais altos do que os pais. Ele concebeu uma forma gráfica de representar as propriedades básicas do coeficiente de correlação. Ele aplicou o seu método de correlação a variações de medidas físicas, por exemplo, mostrou a correlação entre a altura do corpo e o comprimento da cabeça. Seu aluno Karl Pearson desenvolveu a formula matemática, que usamos hoje e que tem o seu nome em homenagem. O símbolo do coeficiente de correlação “r” vem da primeira letra de regressão, em reconhecimentos a Galton.

A correlação é a medida padronizada da relação entre duas variáveis. A correlação nunca pode ser maior do que 1 ou menor do que menos 1. Uma correlação próxima a zero indica que as duas variáveis não estão relacionadas. Uma correlação positiva indica que as duas variáveis movem juntas, e a relação é forte quanto mais a correlação se aproxima de um. Uma correlação negativa indica que as duas variáveis movem-se em direções opostas, e que a relação também fica mais forte quanto mais próxima de menos 1 a correlação ficar. Duas variáveis que estão perfeitamente correlacionadas positivamente (r=1) movem-se essencialmente em perfeita proporção na mesma direção, enquanto dois conjuntos que estão perfeitamente correlacionados negativamente movem-se em perfeita proporção em direções opostas.

Análise de regressão - É uma análise muito útil quando a pergunta a ser respondida sobre uma variável quantitativa for: Por que está variando? Ou, como varia? A análise de regressão tenta construir uma função matemática, um modelo matemático com a finalidade de entender e explicar o comportamento de determinada variável quantitativa. A variável a ser estudada deve ser quantitativa e, apresentada de forma individualizada. A variável qualitativa até pode explicar, mas não pode ser explicada. 1- Regressão simples: uma única variável para explicar outra; 2- Regressão múltipla: várias variáveis na tentativa de explicar uma outra.

Uma regressão simples é uma extensão do conceito correlação. Ela tenta explicar uma variável, a qual é chamada variável dependente, usando a outra variável, chamada variável independente. Mantendo a tradição estatística, seja Y a variável dependente e X a variável independente. Se as duas variáveis são plotadas uma contra a outra num gráfico de espalhamento, com Y no eixo vertical e X no eixo horizontal, a regressão tenta ajustar uma linha reta através dos pontos de tal modo que minimiza a soma dos desvios quadrados dos pontos da linha.Quando tal linha é ajustada, dois parâmetros emergem - um é o ponto em que a linha corta o eixo Y, chamado de intercepção da regressão, e o outro é a inclinação da linha de regressão.

http://www.bertolo.pro.br/AdminFin/StatFile/Image5.gif

A inclinação (b) da regressão mede ambas a direção e a magnitude da relação. Quando as duas variáveis estão correlacionadas positivamente, a inclinação também será positiva, enquanto quando as duas variáveis estão correlacionadas negativamente, a inclinação será negativa.

A intercepção (a) da regressão pode ser lida de várias maneiras. Uma interpretação é que ela é o valor que Y terá quando X é zero. Uma outra é mais direta, e está baseada em como ela é calculada. É a diferença entre o valor médio de Y, e o valor ajustado da inclinação de X.

R² = coeficiente de determinação.Um valor de R-quadrado muito próximo de 1 indica uma forte relação entre as duas variáveis, tanto positiva como negativamente. O modelo em questão (reta) é um bom modelo para a situação estudada? Em outras palavras, é o modelo que retrata adequadamente a realidade? Estamos estudando a variabilidade. O coeficiente de determinação é a medida usual para aferir qualidade, proximidade com a realidade. Seu significado aplicado é se a variabilidade total foi justificada pela variabilidade da variável explicativa adotada. Quanto maior o R², melhor. Uma vez que não se chegou a 100%, o que poderia ser usado para melhorar a proximidade com a realidade? 1- modificar a função (reta); 2- aumentar a base de dados, desde que possível; 3- observar ou detectar pontos discrepantes; 4- acrescentar variável explicativa quantitativa.

 

CÁLCULO DA REGRESSÃO

 

 

Selecione o intervalo de dados da tabela para a variável dependente, eixo Y.

Clique aqui para selecionar. Arraste o mouse nas células.

 

A janela é minimizada para facilita a captura dos dados.

 

 

Quando soltar o clique do mouse aparecerá o assistente. Marque a série de da em colunas e desmarque a primeira linha e a primeira coluna como rótulo.

 


 

Clique em próximo para selecionar os dados da variável independente do eixo X.

 

 

 

Clique em valores de X e em seguida no botão selecionar intervalo de dados. A janela se minimizará novamente.

 

 

Notem que agora temos os valores de X e Y. Clique em próximo para colocar legendas e depois clique em concluir, que o gráfico de dispersão estará pronto.

 


 

Os valores de X e Y estão na planilha ajustada, localizados entre as células C4 a C166 e E4 a E166, respectivamente.

 

 

 

 

 

 

 

 

 

Clique com o botão direito do mouse nos pontos do gráfico e selecione: “inserir linha de tendência”. Aparecerá uma nova janela.

 

Curvas de regressão, também conhecidas por linhas de tendência, podem ser adicionadas a todos os tipos de gráficos 2D, com exceção dos gráficos de pizza e de cotação.

 

 
Texto explicativo em seta para a esquerda:

 

Selecione uma cor, largura da linha e transparência para melhor visualização.

 

 

Clique na aba “Tipo” para definir o tipo de função a ser utilizada. A função linear é mais fácil de ser analisada. Marque para mostrar a equação e o coeficiente de correlação R².

 

 

Temos então o resultado gráfico da regressão.

 

 

Thomas Davenport, autor de “Competição Analítica”, realizou a última palestra do Fórum Mundial de Lucratividade 2009, em São Paulo, 25 de março. Ele explicou ao público presente que a ciência analítica deixou os porões das empresas e subiu ao palco. “Passamos de um mundo em que sistemas de informações serviam para acumular dados para um mundo em que os dados são usados para gerir os negócios”, constata. A inteligência aplicada aos negócios envolve dois tipos de atividade. A mais comum é a dos relatórios. Embora úteis, os relatórios espelham o passado e não explicam por que algo aconteceu. É aí que entra a capacidade analítica das empresas. Davenport dedica-se a estudar o lado humano da ciência aplicada. Para ele, conduzir a competição analítica requer mais do que tecnologia e capacidade da análise. Requer, das pessoas, “o lado direito do cérebro: paixão, intuição, e criatividade”.