본 Polython Ad Hoc Lab에서는 정치학도들의 파이썬 언어 입문을 돕는 가이드북을 노션 페이지로 작성하여 공유하는 것을 목적으로 한다. 오늘날의 정치학은 제도적 이론적 분석을 넘어서 급변하는 4차 산업혁명 시대에 마주하여 데이터에 대한 새로운 시각을 요구하고 있다. 정치학의 분석 대상은 국가 차원에서 개인 차원으로 확대되었고, 연구자들은 주어진 데이터를 수동적으로 사용하는 것을 넘어서 적극적으로 수집하고 스스로 가공해내는 자세가 필요하다. 특히 파이썬은 API 활용, 웹 스크래핑, 텍스트 분석, 머신러닝, 지리공간 분석 등에 있어 널리 사용되는 Stata나 R 프로그램보다 빅데이터 데이터 활용에 장점을 보인다. 그러나 파이썬의 범용성에도 불구하고 높은 진입장벽으로 정치학 대학원생 사이에서 제한적으로만 사용되고 있다. 이에 랩원들은 직접 파이썬을 배워나가며 초심자의 눈높이에서 이해한 파이썬의 기초와 정치학의 렌즈를 통해 적용한 예시들을 공유하여 다른 정치학도들의 입문을 독려하고 이들 연구에 도움이 되고자 한다.
본 애드 혹 랩은 기본적으로 엄기홍 교수님의 “정치학을 위한 파이썬” 교재를 함께 일독하며 교재의 내용과 연습문제를 학습하는 것을 목표로 한다. 세션은 약 2주에 한 번씩 일요일 오전에 진행되며 주차별 발제자가 내용을 간단히 설명하고 준비해온 연습문제를 함께 푸는 형식으로 진행된다. 이미 3월에 두 번의 세션을 진행하여 책의 1장과 2장을 다루었으며 추후 세션은 다음과 같이 진행될 예정이다.
세션 1: 파이썬의 기본 문법 (변수, 데이터 형태), 3월 20일 진행 완료 세션 2: 제어문과 프로그램 구조, 4월 3일 진행 예정 세션 3: 웹 스트랩핑: 웹페이지에서 데이터 가져오기 세션 4: 웹 스크랩핑: 웹페이지 분석 및 데이터의 추출 세션 5: API를 통한 데이터 수집: API에 대한 학습 세션 6: API를 활용한 실습 (네이버, 트위터, 통계청 자료) 세션 7: 빅데이터 시각화와 분석: 한글 형태소 분석/워드 클라우드 세션 8: 빅데이터 시각화와 분석: 의미망 분석 세션 9 개인 파이썬 프로젝트 발표
세션에 활용된 코드와 설명을 비롯하여 사용된 연습문제는 노션 페이지에 모두 업로드할 것이다. 각 주차별 추가로 정치학도들이 관심을 갖거나 실제 연구에 바로 활용할 수 있는 API나 패키지들이 있다면 추가할 예정이다. 또한 연구의 후반부에서는 학습한 내용을 적용하고 각 랩원의 연구 관심사를 기반으로 개인 미니 프로젝트를 진행하고, 이를 노션에 공개할 예정이다.
엄기홍(2018). 정치학을 위한 파이썬. 경북대학교출판부
정치학 대학원생들의 파이썬에 대한 높은 진입 장벽을 낮추기 위한 오픈소스 형식의 파이썬 입문 가이드 로드맵을 제시할 예정이다.결과물 작성에는 두 가지 모델을 참고하였다.
첫 번째 모델은 Andrew Ba 워싱턴 포스트의 신속대응 탐사보도팀 기자가 구축한 “USING R FOR DATA JOURNALISM” 웹페이지이. R을 통해 저널리즘을 위한 데이터 분석을 위한 분석 방법 및 데이터 예시들을 정리하여 초보 기자들을 위한 R 입문 가이드를 제시하고 있다.
두 번째 모델은 Andrew Ba의 가이드를 모티브로 한국의 SBS 데이터 저널리즘 팀 마부작침이 한국어로 작성한 “R만한 데이터저널리즘” 노션 페이지이다.
두 페이지 모두 ①초심자를 대상으로, ②데이터 저널리즘이라는 특정 분야에 쉽게 적용할 수 있는 기자들을 위한 실습 예시들을 포함한다는 특징을 보인다. Polython Ad Hoc Lab 또한 ①입문자를 대상으로 ②정치학을 위한 파이썬 가이드를 오픈소스 형식으로 제작하는 것을 목표로 한다.