선생님! 좋은 강의 너무 감사합니다! 1. 열심히 데이터를 정리해서 분석했는데, 통계적으로 유의하지 않다면.. 연구를 버리고 새롭게 시작을 해야 하나요? 2. 별도의 질문인데요, 강의에 쓰시는 프로그램이 궁금하네요. 공부하면서 활용하고 싶습니다.
@user-qq7oo9vy1k
3 жыл бұрын
교수님 ~! 정제화 작업이란 data 중에서 가설을 채택시킬 만한 data를 선별하라는 말씀 이신가요?
@nonjunmo
3 жыл бұрын
음....그렇다고 볼 수도 있겠습니다. 구채적으로는 더 약간 복집한 의미가 있고요~~
@user-qq7oo9vy1k
3 жыл бұрын
@@nonjunmo 교수님~! 답글 고맙습니다.
@pym1793
4 жыл бұрын
중심극한정리는 표본의 크기가 30개 이상일 때, 표본의 평균이나 분산의 값이 정규분포를 따른다는 정리인데요. 표본의 크기와 표본의 수에 대해서 혼란스러워 질문을 드립니다. 회귀분석의 경우 표본의 수가 30개 이상이면 OK인 이유가 이변량 정규분포를 가정하고 있기 때문이며, 따라서 잔차의 값이 중심극한정리를 따르게 됩니다. 그러나 표본의 수가 30개 이상일때 정규성을 따른다고 하면, 오류가 발생하지 않을까요? 이를테면 스피어만 상관분석을 해야하는 경우임에도, 표본의 수가 30개 이상이라는 이유로 피어슨 상관분석을 진행하게 될 수 있을거 같아요. 모집단이 정규분포를 따르지 않으면, 샘플의 수가 무한대가 되더라도 샘플의 분포는 정규분포를 따르지 않으며, 샘플의 기대값(ex. 동전을 n회 던졌을때, 앞면이 나오는 횟수)의 분포가 정규분포를 따르는 것이 중심극한정리가 아닌가요?
@nonjunmo
4 жыл бұрын
중심극한정리는 원리보다 공식이 훨씬 어려워서 수학적으로 이해하는게 쉽지 않더군요. 논문통계 분석을 하는 입장애서 보면 그보다 데이터의 성질을 먼저 알아야 될 필요가 있지 않을까 생각합니다. 통계학이라기 보다는 데이터를 다루는 사람의 입장에서 말이죠. 논문통계분석에서 많이들 다루는 데이터는 작은 점수범위의 자연수(정수, int)로 구성되는 경우가 허다합니다. 그걸 요인분석이나 신뢰도 분석을 거쳐 차원을 감소시킨다고 해봤자 자연수 사이 몇개의 소숫점인 실수(num)들이 생기게 될뿐이죠. 이론 데이터로 qqplot을 그려보면 이건 뭐 정규성 같기도 하고 아닌거 같기도 한 요상한 그래프가 그려집니다. 그러니 제아무리 샤피로윌크 테스트를 해 본들 절대로 정규성은 확보될리가 없죠. 따라서 논문통계에서 사용되는 데이터는 샤피로 테스트로 정규성을 검사해서는 안될겁니다. 단변량에 대한 왜도와 첨도 정도로 봐야겠죠. 그마저도 연구대상과 측정도구 선정의 현실적인 문제에 의해 분산구조에 이상이 생길 수 있고 곧바로 억제효과로 인해 정규성 자체의 계산이 안되는 일이 발생하기도 합니다. 종합해보면, 통계학에서도 수리적인 부분이 논문통계의 세계에서는 사실상 변용되거니 무시되는 경우가 발생할 수 밖에 없는 현실입니다. 그래서그런지 학문별로 통계적인 적용이 조금씩 다르기도 하고, 통계학과 교수님이 다른 학과의 논문심사에 들어가서 통계부분에서 한마디도 못하고 돌아오는 경우도 있는 것 같습니다(실제로 통계학괴 교수님의 이런 하소연도 들은 적이 있어요). 결국 논문통계분석을 하시는 분들이 본인이 다루는 데이터의 특성을 고려하지 않은 채 너무 수리적으로 파헤쳐 들어가면 통계학적으로 잘 안맞아떨어지는 상황에서 당황하는 경우가 발생하는 것 같습니다. 그래서 저는 통계학 보다는 데이터분석이라는 용어가 좀 더 어울리지 않나 생각합니다.
@pym1793
4 жыл бұрын
@@nonjunmo 제가 완전 논문초짜라서 예민한 부분을 건드렸다면 죄송합니다. 데이터의 특성을 고려하는 것이 우선이며, 수리적으로 타당하면 더 좋다는 정도로 이해하였습니다. 몇개의 데이터를 만져보면서, 정규성 검정을 통과하는 변수를 찾기가 어렵더라구요. 왜도와 첨도로는 통과하지만, 샤피로 윌크의 경우는 특히나 p-value가 0.05보다 낮게 나오는 경우가 많았습니다. 추가적으로 궁금한 점은 1. 사회과학에서 측정한 데이터가 샤피로윌크나 자크베라 검정을 우수하게 통과한다면(p-value=0.7~0.9), 이 자체로 부가적인 발견이라 주장할 수 있을까요?
Пікірлер: 10