Anais do MCSUL 2016 | 7 a Conferência Sul em Modelagem Computacional 16 a 19 de Novembro. Rio Grande, RS, Brasil ANÁLISE DA DISTRIBUIÇÃO AMOSTRAL DE UM MÉTODO DE TRANSFORMAÇÃO DE VALORES CRISP EM VALORES FUZZY Tamara Ost Fracari, tamarafracari@furg.br 1 Fernando Pereira de Tolêdo, ftoledo@furg.br 1 Viviane Leite Dias de Mattos, viviane.leite.mattos@gmail.com 1 1 Universidade Federal do Rio Grande Resumo: O presente estudo apresenta os resultados iniciais de uma análise da distribuição amostral de uma medida de tendência central utilizada em um método de transformação de valores crisp em valor fuzzy, analisando o comportamento de sua distribuição amostral por comparação com a distribuição amostral de medidas de tendência central já utilizadas como a média e a mediana. Por simulação foram obtidas 1000 amostras de tamanho cinco de uma população com distribuição normal. Os resultados encontrados são encorajadores. Palavras-chave: Tendência Central, Distribuições Amostrais, Método de Cheng, Lógica Fuzzy 1. INTRODUÇÃO A análise exploratória de dados pode ser considerada a primeira etapa de uma análise estatística, na qual são identiﬁ- cadas algumas propriedades do conjunto de dados, entre elas a tendência central. De acordo com Weisberg (1992) [7], as medidas de tendência central têm por objetivo determinar o valor central do conjunto de dados. Este valor pode ser chamado de centro da distribuição e pode ser calculado para um número ﬁnito de valores ou para uma distribuição teórica, como, por exemplo, a distribuição normal. De acordo com Dodge (2003) [4] e Upton and Cook (2008) [6], ocasionalmente, alguns autores utilizam a centralidade signiﬁcando a tendência de dados quantitativos de se agruparem ao redor de um valor central. As medidas de tendência central clássicas mais utilizadas são a média aritmética, a mediana e a moda. Atualmente muitos estudos têm sido desenvolvidos com a utilização da métrica fuzzy. Esta métrica, utilizada prin- cipalmente para mensurar variáveis complexas, subjetivas ou mal deﬁnidas, está fundamentada na teoria dos conjuntos fuzzy, recorrente de estudos do matemático Zadeh, em 1965. Segundo Barros and Bassanezi (2006) [1], os números fuzzy que são utilizados na Lógica Fuzzy, podem ser deﬁnidos por diferentes funções de pertinência, tais como: função triangular, trapezoidal ou gaussiana, entre outras. Em estudos que se utilizam desta lógica, muitas vezes pode ser necessário transformar conjuntos de números crisp em números fuzzy. Cheng (2005) [3] propôs um método com esta ﬁnalidade. Neste, um conjunto de números crisp {x 1 ,x 2 , ..., x n } gera um número fuzzy triangular representado por (a, m, b), sendo necessário estimar o centro do conjunto identiﬁcado por ′′ m ′′ e a variabilidade para os valores extremos ′′ a ′′ e ′′ b ′′ . O valor central ′′ m ′′ é importante, pois é o único valor do número fuzzy triangular com grau de pertinência máximo (um). O presente estudo pretende analisar como essa medida se comporta em amostras e comparando sua distribuição amostral com as de medidas de tendência central já utilizadas como a média e a mediana. 2. FUNDAMENTAÇÃO TEÓRICA Segundo Bussab and Morettin (2005) [2], a média aritmética simples é calculada através da soma de todas as ob- servações dividida pelo número delas, sendo uma das medidas mais utilizadas para representar a tendência central. For- malizando o descrito acima, se x 1 ,x 2 , ..., x n são os n valores (distintos ou não) da variável X, a média aritmética, ou simplesmente média de X pode ser calculada pela Eq. (1). X = x 1 + x 2 + ··· + x n n = 1 n n  i=1 x i (1) Bussab and Morettin (2005) [2] deﬁnem a mediana como a observação que ocupa a posição central da série, quando a mesma está ordenada de forma crescente. Tendo uma série com quantidade par de elementos, considera-se a mediana como a média aritmética das duas observações centrais. A mediana da variável X pode ser deﬁnida pela Eq. (2). md(X)=  x ( n+1 2 ) se n ímpar; x ( n 2 ) +x ( n 2 +1) 2 se n par. (2) No modelo de distribuição de probabilidade normal, μ = Md, no caso populacional, ou X = md(X), no caso amostral. A origem a este modelo é dada a Gauss em 1810, em trabalhos sobre erros de observações astronômicas, motivo pelo qual muitas vezes é chamado de distribuição gaussiana.