나의 이야기

Multilevel and Mixed Models Using R(R을 사용한 다단계 및 혼합 모델)

효성공인 2021. 11. 26. 14:05

Multilevel and Mixed Models Using R(R을 사용한 다단계 및 혼합 모델)

 

A 3-Day Remote Seminar Taught by
Stephen Vaisey, Ph.D.

 

 

Multilevel models are a class of regression models for data that have a hierarchical (or nested) structure. Common examples of such data structures are students nested within schools or classrooms, patients nested within hospitals, or survey respondents nested within countries.

다단계 모델은 계층적(또는 중첩된) 구조가 있는 데이터에 대한 회귀 모델 클래스입니다. 이러한 데이터 구조의 일반적인 예로는 학교나 교실에 있는 학생, 병원에 있는 환자 또는 국가에 있는 설문 응답자가 있습니다.

Using regression techniques that ignore this hierarchical structure (such as ordinary least squares) can lead to incorrect results because such methods assume that all observations are independent. Perhaps more important, using inappropriate techniques (like pooling or aggregating) prevents researchers from asking substantively interesting questions about how processes work at different levels.

이 계층 구조를 무시하는 회귀 분석 기법(예: 일반 최소 제곱)을 사용하면 모든 관측치가 독립적이라고 가정하기 때문에 잘못된 결과가 나올 수 있습니다. 더 중요한 것은, (풀링 또는 집계와 같은) 부적절한 기술을 사용하는 것은 연구자들이 프로세스가 서로 다른 수준에서 작동하는 방식에 대해 상당히 흥미로운 질문을 하지 못하게 하는 것이다.

Starting December 9, we are offering this seminar as a 3-day synchronous*, remote workshop. Each day will consist of a 4-hour live lecture held via the free video-conferencing software Zoom. You are encouraged to join the lecture live, but will have the opportunity to view the recorded session later in the day if you are unable to attend at the scheduled time.

12월 9일부터 이 세미나를 3일간의 동기식* 원격 워크샵으로 제공합니다. 매일 무료 화상 회의 소프트웨어 Zoom을 통해 4시간 동안 진행되는 라이브 강의로 구성됩니다. 라이브 강의에 참여하는 것이 좋지만 예정된 시간에 참석할 수 없는 경우 녹화된 세션을 나중에 볼 수 있는 기회가 있습니다.

Each day will include a hands-on exercise to be completed on your own after the lecture session is over. An additional lab session will be held Thursday and Friday afternoons, where you can review the exercise results with the instructor and ask any questions.

매일 강의가 끝난 후 스스로 완수할 실습이 포함될 것이다. 목요일과 금요일 오후에 추가적인 실험실 세션이 열리며, 강사와 함께 실습결과를 검토하고 어떤 질문도 할 수 있다.

*We understand that scheduling is difficult during this unpredictable time. If you prefer, you may take all or part of the course asynchronously. The video recordings will be made available within 24 hours of each session and will be accessible for four weeks after the seminar, meaning that you will get all of the class content and discussions even if you cannot participate synchronously.

*우리는예측할 수 없는 시간 동안 스케줄링이 어렵다는 것을 이해한다. 원하는 경우 코스의 전부 또는 일부를 비동기적으로 사용할 수 있습니다. 영상녹화는 회기 24시간 이내에 이용할있게 되며 세미나가 끝난 4주 동안 접속이 가능해 동시 참여가 불가능하더라도 수업 내용과 토론을 모두 받을있게 된다.

Closed captioning is available for all live and recorded sessions.

닫힌 캡션은 모든 라이브 및 녹음 세션에서 사용할 수 있다.

MORE DETAILS ABOUT THE COURSE CONTENT

강의  내용에 관한 상세한 내용

This seminar provides an intensive introduction to multilevel models. After a brief conceptual introduction (including a discussion of the difference between random and fixed effects), we will begin with simple variance components models that can tell us how much of the variation in a measure can be attributed to different levels of observation. We will then move on to mixed models (random effects models with fixed covariates) that allow us to ask how factors at different levels can affect an outcome.

이 세미나는 다단계 모델에 대한 집중적인 소개를 제공한다. 간단한 개념적 도입(임의 효과와 고정 효과의 차이에 대한 논의 포함) 후에, 우리는 측정값의 변동이 다른 수준의 관찰에 얼마나 기인할 수 있는지를 말해줄 수 있는 단순 분산 구성 요소 모델로 시작할 것이다. 그런 다음 우리는 서로 다른 수준의 요인이 결과에 어떤 영향을 미칠 수 있는지 물어볼 수 있는 혼합 모델(고정 공변량으로 무작위 효과 모델)으로 넘어갈 것이다.

Next, we will investigate how using random coefficients and cross-level interactions can help us discover hidden structure in our data and help us investigate how individual-level processes work differently in different contexts. We will also briefly consider how these techniques can be applied to cases where we have repeated observations of individuals or other entities over time.

다음으로 랜덤 계수와 상호 수준의 상호작용을 사용하여 데이터에서 숨겨진 구조를 발견하는 데 어떻게 도움이 되는지 조사하고 개별 수준의 프로세스가 다른 맥락에서 어떻게 다르게 작동하는지 조사하는 데 도움이 될 것이다. 우리는 또한 이러한 기술들이 시간이 지남에 따라 개인이나 다른 실체에 대한 반복적인 관찰을 한 경우에 어떻게 적용될 수 있는지 간략하게 고려할 것이다.

Although the course will focus primarily on the continuous outcome case, we will also briefly cover how these models can easily be extended for use with categorical and limited dependent variables.

이 과정은 주로 연속적인 결과 사례에 초점을 맞출 것이지만, 우리는 또한 범주적이고 제한된 종속 변수로 사용하기 위해 이러한 모델들이 어떻게 쉽게 확장될 수 있는지를 간략하게 다룰 것이다.

The seminar will focus on hands-on understanding and draw from examples across the social and behavioral sciences. At the conclusion of the course, you will:

세미나는 실제 이해에 초점을 맞추고 사회 및 행동 과학 전반에 걸친 사례에서 도출합니다. 과정이 끝나면 다음을 수행하게 됩니다.

 

Know the technical and substantive difference between fixed and random effects.

고정 효과와 무작위 효과 사이의 기술적이고 실질적인 차이점을 알고 있습니다.

Understand random intercepts and random coefficients and when to use each one.

임의 절편 및 임의 계수와 각각을 언제 사용해야 하는지 이해합니다.

Know how to combine the strengths of random-effects and fixed effects approaches into a single model.

무작위 효과와 고정 효과 접근 방식의 장점을 단일 모델로 결합하는 방법을 알고 있습니다.

Know how to estimate these models and interpret the results.

이러한 모델을 추정하고 결과를 해석하는 방법을 알고 있습니다.

 

Although these techniques apply to both nested and longitudinal data, in the interest of (을 위하여)time we will focus exclusively on the nested data case. For a course focused on longitudinal data analysis, check out Longitudinal Data Analysis Using R

이러한 기술은 중첩 데이터와 종단 데이터 모두에 적용되지만 시간을 위해 중첩 데이터 사례에만 집중할 것입니다. 종단 데이터 분석에 중점을 둔 과정은 R을 사용한 종단 데이터 분석을 확인하십시오.

 

COMPUTING

계산

The vast majority of what you will learn in this course can be applied in any software package. However, this seminar will mostly use R for empirical examples and exercises. To replicate the instructor’s workflow in the course, you should have R and RStudio already installed on your computer when the course begins. No previous experience with R is needed, however, because all necessary code will be provided. For those who prefer Stata, complete Stata code for all analyses will be provided on request.

이 과정에서 배우게 될 대부분의 내용은 모든 소프트웨어 패키지에 적용할 수 있습니다. 그러나 이 세미나에서는 대부분의 실증적 예제와 연습을 위해 R을 사용할 것입니다. 코스에서 강사의 워크플로를 복제하려면 코스가 시작될 때 컴퓨터에 R 및 RStudio가 이미 설치되어 있어야 합니다. 그러나 필요한 모든 코드가 제공되기 때문에 R에 대한 이전 경험은 필요하지 않습니다. Stata를 선호하는 분들을 위해 요청 시 모든 분석에 대한 완전한 Stata 코드가 제공됩니다.

If you’d like to take this course but are concerned that you don’t know enough R, there are excellent on-line resources for learning the basics. Here are our recommendations.

이 과정을 수강하고 싶지만 R에 대해 충분히 알지 못한다고 걱정된다면 기본을 배울 수 있는 훌륭한 온라인 리소스가 있습니다. 다음은 권장 사항입니다.

 

WHO SHOULD REGISTER? 

누가 등록해야 합니까?

This course is for anyone who wants to learn to apply multilevel models to observational data. You should have a basic foundation in linear regression.

이 과정은 관측 데이터에 다단계 모델을 적용하는 방법을 배우고자 하는 모든 사람을 위한 것입니다. 선형 회귀에 대한 기본 기초가 있어야 합니다.

 

SEMINAR OUTLINE

세미나 개요

 

What are multilevel models?

다단계 모델이란 무엇입니까?

Hierarchical linear model motivation and notation

계층적 선형 모델 동기 및 표기법

Within and between variance

분산 내 및 간

Variance components models and plots

분산 성분 모형 및 도표

The first distinction between “random” and “fixed” effects

"임의" 효과와 "고정" 효과의 첫 번째 차이점

“Shrinkage” and empirical Bayes estimates of intercepts

절편의 "수축" 및 경험적 Bayes 추정

What are mixed models a mix of?

혼합 모델은 무엇을 혼합합니까?

Three types of R-squared

세 가지 유형의 R-제곱

Random coefficients/slopes

랜덤 계수/기울기

Model selection with BIC and AIC

BIC 및 AIC를 통한 모델 선택

 

AIC(Akaike Information Criterion)

아카이케 정보 기준)

BIC(Bayes Information Criterion)

베이즈 정보 기준)

Basic diagnostics

기본 진단

The second distinction between “random” and “fixed” effects

무작위" 효과와 "고정" 효과의 두 번째 구분

When and why (not) to use random effects models

랜덤 효과 모델을 사용하는 시기와 이유(안)

Testing the random effects assumption

랜덤 효과 가정 테스트

The “between-within” method to combine the best of RE/FE(The Random Effects (RE) and Fixed Effects (FE) Models)

RE/FE의 장점을 결합하는 "사이-내" 방법

Centering and cross-level interactions

중심 상호 수준 상호작용

A brief comparison of clustered and panel data

클러스터 데이터와 패널 데이터의 간략한 비교

인공지능(AI) 연구는 빅데이터 처리를 기반으로 한다데이터 특성을 고려해 비슷한 특성을 가진 데이터를 한 그룹으로 묶어 나누는 '클러스터링(Clustering)'은 빅데이터 처리의 가장 기본적인 작업이라고 할 수 있다.

 

패널데이터 ( 영어: panel data )는 종단자료( 영어: longitudinal data )라고도 하며, 여러 개체들을 복수의 시간에 걸쳐서 추적하여 얻는 데이터를 말한다(출처: 한치록, 2017). 패널 데이터는 다양한 방식으로 얻을 수 있다. 개인이나 가구의 패널 데이터는 흔히 패널조사를 통하여 얻는다.

 

Multilevel logistic regression and other limited dependent variables

다단계 로지스틱 회귀 및 기타 제한된 종속 변수

 

로지스틱 회귀(영어: logistic regression)는 영국의 통계학자인 D. R. Cox가 1958년에 제안한 확률 모델로서 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법이다.

Presenting results

결과 발표

 

REVIEWS OF MULTILEVEL AND MIXED MODELS USING R

R을 사용하는 다단계 및 혼합 모델의 검토

 

“I appreciated the lecturer’s focus on providing the reasons why mixed models should be used and clarifying with examples “where” the variance may lie. Also, he was very helpful in addressing students’ questions and indicating the complexity of this topic due to terminology that varies across fields.”

"혼합 모델을 사용해야 하는 이유를 제공하고 분산이 "어디"에 있을 수 있는지 예를 들어 설명하는 데 강사가 집중한 점에 감사했습니다. 또한, 그는 학생들의 질문을 해결하고 분야에 따라 다양한 용어로 인해 이 주제의 복잡성을 나타내는 데 매우 도움이 되었습니다.”
 

Luisa Mimmi, Ministry of Finance

Luisa Mimmi, 재무부

 

“Steve was engaging and provided a solid conceptual foundation of MLM. Working through examples and interpretations of results was helpful.”
  Rachel Siciliano, Vanderbilt University

“Steve는 매력적이었고 MLM의 견고한 개념적 기반을 제공했습니다. 예제와 결과 해석을 통해 작업하는 것이 도움이 되었습니다.”
   레이첼 시칠리아노, 밴더빌트 대학교

“This seminar was incredibly well-paced and had good examples that really addressed the practicality and reality of situations rather than just focusing on theory and formulas.”
  Catherine Wilhelm, University of Southern Mississippi

“이 세미나는 이론과 공식에 초점을 맞추기보다는 상황의 실용성과 현실을 실제로 다루는 좋은 예가 매우 잘 진행되었고 좋은 예가 있었습니다.”
   캐서린 빌헬름, 서던 미시시피 대학교

“I took Dr. Vaisey’s Multilevel and Mixed Models Using R workshop remotely, watching the Zoom lectures. Even through this truly remote course, Dr. Vaisey’s teaching style made the course enjoyable and incredibly informative and helpful. His emphasis on ensuring we understood the fundamentals of MLMs as opposed to just learning R code or “what can I do with my dataset” gave me a strong foundation of understanding MLMs, their applications, and interpretations. Dr. Vaisey also worked through “office hours” or lab sessions in which he applied MLMs to examine a dataset and answer research questions, and altogether(또한 the lectures and labs reinforced learning in a structured way. I couldn’t recommend this course with Dr. Vaisey any more strongly!”

"저는 줌 강의를 보면서 원격으로  R를 사용하는 Vaisey 박사의 Multilevel 및 Mixed Model 워크샵을 수강했습니다. 이 진정하게 원격 코스를 통해서도, 바이제이 박사의 교육 방식은 이 코스를 즐겁고 믿을 수 없을 만큼 유익하고 유익하게 만들었습니다. R 코드만 배우거나 "내 데이터 세트로 무엇을 할 수 있는가"와는 반대로  MLM의 기본 원리를 이해하도록 확인하는 것에 대한 그의 강조는 MLM, 그 응용 프로그램 및 해석을 이해하는 강력한 토대를 제공했습니다.  Vaisey 박사는 또한 "사무시간"이나 실험실 세션을 통해 데이터 세트를 조사하고 연구 질문에 답하기 위해 MLM을 적용했으며 강의와 실험실은 모두 구조화된 방식으로 학습을 강화했다.          저는 더 이상 Vaisey 박사와 함께 하는 이 코스를 강력히 추천할 수 없습니다.


  Jean Ho, University of California, Irvine

Jean Ho, 캘리포니아 대학교 어바인

 

“Dr. Vaisey was an amazing instructor. He explained complex models clearly and practically and in a way in which I could also apply the information to my own research. I came out of this course feeling much more confident in multilevel and mixed model analysis.”

“박사. Vaisey는 놀라운 강사였습니다. 그는 복잡한 모델을 명확하고 실용적으로 설명했으며 정보를 내 자신의 연구에도 적용할 수 있는 방식으로 설명했습니다. 다단계 및 혼합 모델 분석에 대해 훨씬 더 자신감을 갖고 이 과정을 마쳤습니다.”
  

Tara Powell, University of Illinois

타라 파월, 일리노이 대학교

 

“The in-depth explanations from the lecturer were great. His passion for teaching reflected in very practical examples, which were extremely helpful. Many thanks to Stephen!“

강사님의 심도 있는 설명이 좋았습니다. 가르치는 것에 대한 그의 열정은 매우 실용적인 예에 반영되어 매우 도움이 되었습니다. Stephen에게 많은 감사를!””


  Janja Snoj Tratnik, Jozef Stefan Institute

Janja Snoj Tratnik, 요제프 스테판 연구소

“I liked the solid discussion of the conceptual grounding for these models.”
  Dawna Duff, University of Pittsburgh

"이 모델에 대한 개념적 기반에 대한 확실한 토론이 마음에 들었습니다."
   Dawna Duff, 피츠버그 대학교

“This course gives consideration to understanding what R does when running MLM and the conceptual aspects of MLM.”

"이 과정은 MLM을 실행할 때 R이 무엇을 하는지 이해하고 MLM의 개념적 측면을 고려합니다."
  Shannon Coulter, San Diego County Office of Education

Shannon Coulter, 샌디에이고 카운티 교육청