Tuesday 5 September 2017

Referência Categoria Binário Opções


Estou tentando analisar os meus dados usando Regressão Logística Multinomial em que minha variável dependente é um resultado clínico doente vs saudável e 1 variáveis ​​independentes Fatores estão em várias categorias. O problema que tenho é tentar descobrir como eu posso definir um da categoria como Um grupo de referência em SPSS. I fiz a análise inversa através da mudança de variáveis ​​dependentes e fatores para que eu possa definir a referência, mas depois de agora que eu penso sobre isso, percebo que doesn t faz muito sentido eu também comparou os valores OR de MLR para Que de uma análise 2x2, mas é muito diferente. Eu também tentei regressão logística binária e criou variáveis ​​dummy para cada categoria, mas eu didn t têm valores sensíveis ou. EDIT SPSS comando e saída Eu definir a primeira categoria 1 na minha variável independente como Referência. Se sua variável dependente é binária, a regressão logística binária é o caminho a percorrer O que você quer dizer com 1 variáveis ​​independentes Fatores Qual variável apresenta um problema com a definição do gato de referência Egory O que especificamente não faz muito sentido Além disso, como sobre mostrando seus comandos e sua saída para que os voluntários aqui podem ajudá-lo a interpretar e resolver problemas rolando2 Jul 14 14 at 21 43.You pode conseguir o que você está olhando para fazer através do seguinte. Utilizar binário Regressão logística. Adicionar o binário Status doente vs variável saudável como o dependente Recode se necessário para que doente 1 ou saudável 1 eo outro é 0, dependendo se você está mais interessado em modelar as probabilidades de log de estar doente ou de ser saudável. Asignar uma categoria de referência para a variável de grupo usando o comando Contraste arquivos de Ajuda ou um guia de sintaxe irá ajudá-lo a escolher entre opções como Indicador ou Desvio contrastes Indicador provavelmente será mais conveniente e na mecânica de atribuir uma categoria, como GCA Como a referência a que outros serão comparados. A criação de variáveis ​​dummy para representar um preditor, como o Grupo, é útil em alguns casos, mas provavelmente não é necessária aqui SPSS wil Eu crio estes manequins para você como parte do contraste que você especifica Mais tarde, se você precisar usar a saída de regressão para criar uma equação preditiva, há um atalho para fazê-lo sem criar manequins que eu possa compartilhar com você separadamente se for necessário. - para atribuir um grupo específico como a categoria de referência. Isto irá mostrar-lhe a ordem das categorias como SPSS vê-los Vamos supor GTG é terceiro Então GTG pode ser atribuído como a categoria de referência, usando este subcomando na regressão. É codificado como 1 para a variável de estado, cada coeficiente de grupo na regressão, quando exponenciado, irá dizer-lhe a razão entre as probabilidades desse grupo de ter um resultado saudável e as probabilidades do grupo GTG de ter um resultado saudável. PASW SPSS. When usamos uma regressão logística Quando queremos produzir odds ratios para ver se as nossas variáveis ​​independentes, por exemplo, fumar nunca fumante, ex-fumante, fumante atual prevê maiores probabilidades da variável dependente por exemplo Depressão sim ou não A variável de desfecho deve ter 2 categorias. Exemplo Cenário Calculando o odds ratio de ter depressão com base no comportamento de fumo das pessoas. Neste cenário, nossa variável dependente é depressão e tem 2 categorias 1 Nenhuma categoria de referência 2 Sim Nosso Variável independente é o comportamento do tabagismo, e tem 3 categorias 1 categoria de referência nunca fumado 2 ex-fumante 3 fumante atual. Our questão de pesquisa é Comparado com aqueles que nunca fumaram, fazem aqueles que são ex-fumantes e ou aqueles que são fumantes atuais têm Maior probabilidade de ter depressão. Etapa 1 Analise - Regressão - Logística Binária. Etapa 2 Selecione a variável dependente depressão e movê-la para a caixa Dependente Mova a variável independente smoke3 na caixa Covariates. Passo 3 Clique na caixa Categórica Move smoke3 para o categórico Covariates box porque smoke3 é uma variável categórica não precisa desta etapa se sua variável independente for uma variável contínua Selecione First como a Categoria de Referência e Clique em alterar, porque queremos que o primeiro grupo nunca fumado para ser a categoria de referência. Passo 4 Clique na caixa de opções Tick CI para exp B 95 - isso lhe dará 95 intervalos de confiança para suas odds ratios. As 95 IC não se sobrepõem, Podemos concluir que, em comparação com aqueles que nunca fumaram, os ex-fumantes têm 1 14 vezes as chances mais elevadas 95 IC 1 05 a 1 24 e os fumantes atuais têm 1 79 vezes as chances mais elevadas 95 IC 1 64 a 1 95 serem deprimidas. 2010 Web Development Team. How podemos mudar a categoria de referência para uma variável categórica Esta questão surge muitas vezes em uma consultoria practice. When incluindo covariados categóricos em modelos de regressão, há uma questão de como incorporar as categorias Um método simples é gerar 3.Na abordagem das variáveis-indicadores, são geradas novas variáveis ​​dicotômicas para todas, exceto uma das categorias que elas têm Um valor de 1 se o sujeito estiver na categoria e 0 caso contrário SAS e R cada um tem maneiras simples de fazer isso sem criar explicitamente novas variáveis ​​No SAS, muitos procedimentos aceitam uma instrução de classe, enquanto que em R uma variável pode ser definida como um fator , Por exemplo usando. Vamos considerar um exemplo simples com a seguinte exibição de uma variável categórica e os indicadores resultantes. Quando nós ajustamos o modelo, o para Metro associado com a variável indA é uma estimativa da diferença entre as categorias A e D Mas o que se queremos a diferença entre A e C Bem, podemos tirar nossas calculadoras, mas também gostaríamos do erro padrão dessa diferença estimada Uma Maneira de fazer isso é mudar a categoria de referência, e é isso que vamos explorar hoje Em uma entrada futura, vamos demonstrar como calcular comparações arbitrárias, ou contrastes, sem reajustar o modelo Esse método é provavelmente superior à mostrada aqui , Mas como consultoria estatísticos, a questão de como posso alterar a categoria de referência é um que muitas vezes answer. For procs logística genmod phreg e surveylogistic você pode usar a opção ref, da seguinte forma. Infelizmente, a mudança de referência no SAS é estranho para outros procedimentos O SAS padrão é fazer a última categoria o referente, quando a última é determinada pela ordenação dos caracteres Para alterar isso, use a opção de ordem, freqüentemente uma opção para a instrução de classe, mas someti Mes uma opção para a instrução proc Se o referente desejado for a primeira categoria, você pode torná-lo o referente classificando a variável em ordem decrescente e, em seguida, usando a opção de dados da ordem. Se a categoria de referência desejada for lexicograficamente no meio da Lista, a sua melhor aposta é a re-código das categorias Meu colega Sheryl Rifas-Shiman renomeia os rótulos como, ega azul, b outro, c marrom Então classificar sobre a nova variável e usar a abordagem de dados de ordem Você também pode ter sorte através da classificação Em alguma outra variável no conjunto de dados e usando dados de ordem. Como um exemplo, consideramos a análise simples de covariância discutida na seção 3 7 2 A célula padrão de referência para a substância é a heroína Podemos substituir isso com álcool usando a abordagem de classificação. Que o SAS cria os níveis para a interação com base nas mesmas variáveis ​​indicadoras implícitas. Em R existem várias opções para alterar a célula de referência O mais simples destes pode ser a função relevel Os dois argumentos são O nome do fator ea categoria de referência desejada A função pode ser aninhada dentro de relevel se necessário. Comentários da primeira edição. Colocando as soluções de R e de SAS junto e cobrindo uma disposição vasta das tarefas em um livro, Kleinman e Horton adicionaram o valor surpreendente ea searchability à informação em seu livro um home run e é um livro que eu sou grato para ter o assento, Livre de poeira, na minha estante Robert Alan Greevy, Jr, Ensino de Estatística nas Ciências da Saúde. Eu uso SAS e R em uma base diária Cada um tem pontos fortes e fracos, e usando ambos dá a vantagem de ser capaz de fazer quase nada quando se trata de manipulação de dados, análise e gráficos Se você usar SAS e R em um Se você conhece um dos pacotes e está aprendendo o outro, você pode precisar de mais do que este livro, mas obter este livro, too. Charles Heckler, Universidade de Rochester, Technometrics. O excelente cruzamento de referência com outros tópicos e exemplos finais de capítulo sobre a avaliação de Saúde e vinculação ao conjunto de dados de cuidados primários é dado com cada tópico os usuários que são proficientes em qualquer um dos pacotes de software, mas com a necessidade de usar o outro vai Encontrar este livro útil Frances Denny, Jornal da Sociedade Estatística Real Series A. About SAS e R. Este blog é onde nós publicamos exemplos adicionais para os nossos livros sobre SAS e R Amazon SAS e R. Please também visitar o site para o livro Onde o código do livro e as informações adicionais estão disponíveis. Outro recurso é o StatSoftEquivs wiki Você pode adicionar a it. Blogger só permite um autor por post, mas nós colaboramos ativamente na maioria das entradas e compartilhamento de crédito e responsabilidade. SAS e R blog por Ken Kleinman e Nicholas Horton está licenciado sob uma Licença Creative Commons Atribuição-Uso Não-Comercial-ShareAlike 3 0 Unported License. Topics discutido. Strategias para Escolher a Categoria de Referência em Codificação Dummy. Every estatística Software que os códigos de fictícia predictor variáveis ​​usa um padrão para a escolha da categoria de referência. Este padrão é geralmente a categoria que vem em primeiro ou último em ordem alfabética. Que pode ou não ser a melhor categoria para usar, mas, felizmente, você não está preso com os padrões Portanto, se você escolher, qual deve escolher. A primeira coisa a lembrar é que, em última análise, realmente não importa, desde que você esteja ciente de qual categoria é a referência Você vai obter os mesmos resultados, não importa O que você escolhe É apenas que as comparações específicas que o software relata e dá-lhe p-valores para serão diferentes. Então é melhor escolher uma categoria que torna a interpretação dos resultados mais fácil Aqui estão algumas opções comuns para a escolha de uma categoria. Lembre-se , Os coeficientes da regressão dar-lhe-ão a diferença nos meios e nas inclinações se você incluiu um termo da interação entre cada uma outra categoria e a categoria de referência. Estratégia 1 Use a categoria normativa. Em muitos ca Por exemplo, em um conjunto de dados que eu analisei, um importante predito indicador codificado é o status de pobreza na pobreza ou não na pobreza. Não na pobreza é a norma a maioria das pessoas não são Em Pobreza, pelo menos, neste conjunto de dados pode não ser verdade na população que você está estudando A comparação interessante é ver como as pessoas na pobreza diferem deste grupo normativo Assim fazendo Não na pobreza o grupo de referência só faz sentido. Da mesma forma, outro exemplo É o estado civil nunca casado, atualmente casado, divorciado, separado ou viúvo. O padrão alfabético tornaria viúvo o grupo de referência Mas não é tão interessante comparar pessoas separadas para as pessoas viúvas, como eles re ambos os pequenos grupos no conjunto de dados, E as comparações mais interessantes são com as categorias normativas de nunca casado ou atualmente casado. Em experimentos ou ensaios de controle randomizado o grupo de controle é uma categoria normativa natural. Xception Eu posso pensar é um estudo com vários controles, mas apenas uma intervenção ou grupo de tratamento Nesse caso, pode ser mais importante para medir qualquer diferença entre o tratamento e cada controle. Strategy 2 Use a categoria maior. O outro problema com Usando o grupo Viúvo como a referência é muito, muito pequeno Quando tamanhos de amostra são muito desiguais nos grupos, o que é muito comum para grupos que ocorrem naturalmente, pode tornar-se problemático usá-lo como a referência. Às vezes, se não houver Normativo em um sentido lógico, faz sentido usar apenas a categoria maior como a referência. Estratégia 3 Use a categoria cuja média está no meio ou, inversamente, em um dos ends. Sometimes todas essas opções falhar Não há Padrões óbvios e tamanhos de amostra são semelhantes. Nesses casos, às vezes a melhor coisa a fazer é escolher a categoria com o mais baixo, o mais alto, ou a média média Deixe-me dar-lhe um exemplo. Vamos dizer que as 5 categorias conjugais têm meios Em Y Of.10 Never Married.11 No momento Married. If o teste F total na tabela ANOVA é significativo para esta variável, você já sabe que as médias mais altas e mais baixas são significativamente diferentes Você apenas don t saber qual dos três médios são significativamente diferentes Por exemplo, o valor médio aqui é 11, a média para pessoas casadas atualmente Se você usar isso como o grupo de referência e descobrir que é significativamente menor que 15, a média para pessoas separadas e 19, a média para Viúva, você sabe que tanto 9 para Divorciado e 10 para Nunca Casado deve ser muito Nota, isso não sempre se mantém se alguns grupos têm tamanhos de amostra muito menor, mas enquanto eles são razoavelmente iguais, deve prender. Você não vai saber , Por exemplo, se houver uma diferença significativa entre os meios para os grupos Separado e Viúvo, mas se isso não é uma comparação teoricamente importante, você está feito. Esta estratégia particular não funciona sempre, mas você pode usá-lo para sua vantagem Wh Se você quiser saber mais sobre a interpretação de coeficientes, em um de meus webinars eu literalmente passei pela saída de um modelo com preditores categóricos e contínuos e uma interação, e fomos passo a passo através de como ler Os coeficientes. Learn mais sobre os prós e contras de interpretação de coeficientes de regressão em nosso novo On Demand workshop Interpretando Coeffcients Tricky Regressioning. Related Posts. In modelos de dados binários e multinomial, o nível de resposta ordenação é importante porque reflete o seguinte. Cuja probabilidade é modelada com dados binários. Como categorias são ordenadas para dados ordinais. Esta categoria serve como a categoria de referência em modelos nominais de modelos logit generalizados para dados nominais. Você deve ver a tabela de Perfil de Resposta para garantir que as categorias estejam devidamente organizadas e que O resultado desejado é modelado Nesta tabela, os níveis de resposta são organizados pelo Valor Ordenado O menor nível de resposta é atribuído Valor Ordenado 1, o valor mais baixo seguinte é atribuído ao valor ordenado 2 e assim por diante. Em modelos binários, a probabilidade modelada é a probabilidade do nível de resposta com o menor valor ordenado. Você pode alterar qual probabilidade é modelada e o valor ordenado na tabela Perfil de resposta Com as opções DESCENDING EVENT ORDER e REF response variável na instrução MODEL Consulte a seção Ordering de Nível de Resposta no Capítulo 51, O Procedimento LOGISTIC, para obter exemplos de como usar essas opções para afetar a probabilidade de ser modelado para dados binários. Para modelos multinomiais, A ordenação de nível de resposta afeta dois aspectos importantes Nos modelos de link cumulativo as categorias são assumidas ordenadas de acordo com o seu Valor Ordenado na tabela Perfil de Resposta Se a variável de resposta é uma variável de caractere ou tem um formato, você deve verificar esta tabela cuidadosamente se Os valores ordenados refletem a escala ordinal correta. Em modelos logit generalizados para dados multinomiais com categorias não ordenadas, um resp Onse é escolhida como a categoria de referência na formulação dos logs generalizados Por padrão, o preditor linear na categoria de referência é definido como 0 ea categoria de referência corresponde à entrada na tabela do perfil de resposta com o maior valor ordenado Você pode Afetam a atribuição de valores ordenados com as opções DESCENDING e ORDER na instrução MODEL Você pode escolher uma categoria de referência diferente com a opção REF A escolha da categoria de referência para modelos logit generalizados afeta os resultados Às vezes é recomendado que você escolha a categoria com A maior freqüência como a referência, por exemplo, Brown e Prescott 1999, p 160 Você pode conseguir isso com o procedimento GLIMMIX combinando as opções ORDER e REF, como nas seguintes instruções. A opção FREQ ORDER organiza as categorias por freqüência descendente A opção REF FIRST seleciona a categoria de resposta com o menor valor ordenado como a categoria mais freqüente Referência.

No comments:

Post a Comment