9회 독서모임 후기

[빅데이터 시대, 성과를 이끌어 내는 데이터 문해력]

날짜: 2월 19일 저녁 7시
참석자: 쎈, 켄타, 지한, 우성

데이터 분석 책 평가: 프로세스 중심 접근

– 기능 설명 위주가 아닌, 데이터 분석의 전체 프로세스를 쉽게 설명한 점이 긍정적 평가를 받았다.

– 특히, 평가 단계와 원인 분석 단계에 필요한 기술들을 명확히 제시한 것이 강점으로 언급되었다.

– 독자 스스로 소규모 프로젝트를 진행할 수 있을 정도로 실용적인 내용을 포함하고 있으나, 그 가능성에 대한 의문도 제기되었다.

데이터 문해력 향상을 위한 책 소개

– 시중 데이터 분석 관련 도서들은 통계 이론 설명으로 어렵게 시작하지만, 소개된 책은 목차만으로도 내용 이해가 가능할 정도로 구성이 잘 되어있다.

– 기술적 측면에 치우친 데이터 분석 인식을 바꿔주고, 방향타 역할을 하는 책으로, 실무 데이터보다 쉽게 접근 가능한 데이터를 활용하여 설명한다.

– 산정도 분석 예시를 통해 데이터 분석 방법을 간단하게 보여주는 등 실용적인 측면도 갖추고 있다.

데이터 문해력 향상 도서 분석

– 데이터 문해력 향상을 목표로 도서를 읽었으나, 중간에 내용 이해에 어려움을 느껴 반복해서 읽는 과정이 필요했다.

– 책의 예제가 반복적이었고, 후반부 질문들이 앞서 다룬 내용과 중복되어 독자의 생각을 묻는 것처럼 느껴지지 않았다.

– 데이터 분석 프로젝트 초기 단계에 있는 독자에게는 도움이 될 수 있으나, 완전한 초보에게는 다소 어려울 수 있다는 의견이 제시되었다.

데이터 분석 접근 방식의 차이

– 데이터 축적 후 활용 방안 모색과 목적 설정 후 접근 방식의 차이점에 대한 고찰

– 데이터 분석 의뢰 시 데이터 축적 우선 vs. 소량 데이터 활용 분석의 상반된 접근법 비교

– 목표 설정 없이 데이터 분석을 시작하는 경우와 목표가 명확한 상태에서 분석하는 경우의 차이점 제시

데이터 분석 접근 방식의 변화

– 과거에는 가설 설정 후 데이터 조사 및 결과 도출 방식이 일반적이었으나,

– 최근에는 데이터를 먼저 확보하고 AI를 활용하여 인사이트를 도출하는 방식이 등장하였고,

– 목적 설정 후 데이터 수집이 효율적이며, 데이터 분석 관련 취업 준비생들은 툴 습득에 치중하는 경향이 있다.

데이터 분석 접근 방식의 장단점 및 개선 방안

– 목적 중심적 데이터 분석은 끼워 맞추기식 해석의 위험이 있으며, 분석 과정의 어려움을 야기할 수 있다.

– 도식 중심의 자료 제시는 시각적 효과는 뛰어나지만, 데이터의 객관성을 저해할 가능성이 있다.

– 매출 하락 원인 파악을 위한 단계적 접근 방식 제시: 데이터 수집, 현상 파악, 원인 분석, 프레젠테이션.

데이터 분석 수업 계획 및 어려움

– 세 번째 읽는 책을 활용한 데이터 분석 수업 계획.

– 매출 하락 원인 파악을 위한 데이터 분석 방법 논의 (기술 통계 활용).

– 회사 내 데이터 분석 인력 부재로 인한 자료 요청 및 분석 방향 설정 어려움.

데이터 분석 관련 도서 출판 및 교육 과정 고찰

– 구글 워크스페이스 활용한 간단한 데이터 인프라 구축 가능성 제시.

– 데이터 분석 교육 과정 설계 시, 참여자의 데이터 분석 경험 및 목표 수준 고려 중요성 강조.

– 데이터 분석 관련 도서의 내용 난이도와 대중적 접근성 문제점 지적 및 출판사 관심 배경 설명.

데이터 분석의 오해와 진실

– 데이터 분석 능력에 대한 현장의 혼란과 오해를 다룬 논의.

– 데이터 분석 도구 사용과 실제 데이터 기반 통찰력 도출의 차이점 제기.

– 데이터 수집 및 활용 과정의 어려움과 목표 설정의 중요성 강조.

데이터 분석 접근법에 대한 새로운 관점

– 데이터 분석 입문서로서 전문 용어를 최소화하여 일반인의 이해도를 높이는 데 중점을 둔다.

– 평균, 분산과 같은 통계적 개념을 단순한 수치 제시가 아닌, 비교라는 관점에서 설명하여 접근성을 높였다.

– 현상 파악 후 평균, 기대값 산출보다는 비교를 통한 평가를 강조하며, 평균의 의미를 비교의 관점에서 재해석한다.

데이터 해석의 새로운 관점

– 데이터 분석에서 평균, 중앙값, 분산 등 통계적 개념을 넘어 데이터 자체에 정답이 없다는 점을 강조하는 책의 내용을 다루고 있다.

– 데이터 분석 결과 해석에 있어 다양한 의견을 수용하는 자세와 그래프 디자인의 중요성을 언급하며, 단순한 데이터 제시를 넘어 여러 요소를 고려해야 함을 시사한다.

– AI와 데이터 분석의 유사점을 언급하며, 데이터가 정답을 제시한다는 고정관념에서 벗어나 다양한 해석을 허용하는 접근 방식을 제시한다.

인공지능과 유사한 접근 방식의 책

– 인공지능 활용 방법과 유사하게 구체적인 작성 방법 제시

– 질문의 구체성에 따라 답변 질이 달라지는 점 강조

– 통계 분석 접근 방식이 기존 방식과 달리 이해도 향상에 기여

데이터 분석 프로젝트: 남녀공학 전환 효과 분석

– 얼룩소라는 서비스에서 진행했던 데이터 분석 공모전 프로젝트 소개.

– 남녀공학 전환에 따른 학업 성적 변화 분석을 주제로 데이터 분석 진행.

– 학교 성적 및 남녀 비율 데이터를 활용하여 남녀공학 전환 효과 분석 계획.

고교 성적 분석: 성별보다 학교 유형의 영향

– 고등학교 성적 분석에서 성별보다 학교 유형(사립/공립)이 성적에 더 큰 영향을 미친다는 연구 결과를 제시.

– 수능 성적 데이터 분석을 통해 남녀 공학, 남학교, 여학교 간 성적 차이가 미미함을 확인.

– 단순히 남녀 성별을 비교하는 것보다 학교 운영 방식에 대한 이해가 성적 분석에 중요함을 강조.

데이터 분석 프로젝트: 수능 점수 분석

– 수능 점수를 단순히 쪼개는 것이 아니라 등급(1~9등급)으로 나누어 분석하는 방법을 제시.

– 수능 점수 데이터를 1, 2등급, 3등급, 중급, 하급으로 카테고리화하여 분석하고, 누적 막대 그래프를 활용.

– 데이터 양이 많지 않아도(몇백 명, 국영수 점수) 평균이나 총합을 이용한 프로젝트 진행이 가능하며, 빅데이터 분석이 아닌 소규모 데이터 분석의 가능성을 보여줌.

능력 측정의 어려움과 문제 정의의 중요성

– 능력을 수치화하는 어려움에 대한 논의가 이루어짐.

– 한국 내 능력 단위를 9개로 나누어 분석한 자료 언급, ITR 기술직이 상위권, 메타인지가 하위권에 위치.

– 능력 측정의 어려움과 문제 정의의 중요성 강조, 문제 정의가 부족하면 결과가 두루뭉술해짐을 지적.

상관계수 분석 과정에 대한 고찰

– 대학 시절 배운 상관계수 분석 프로그램과의 차이점에 대한 논의.

– 상관계수 분석의 목적과 시각적 데이터 분석 방법, 행렬을 이용한 상관계수 구하는 과정 설명.

– 데이터 탐색 과정에서 상관계수 분석의 위치와, 분석 접근 방식의 사람마다의 차이점에 대한 언급.

데이터 분석 과정의 탐색과 가설 검정

– 데이터 간 상관관계 탐색 과정은 여러 데이터 그룹을 분석하며 진행되고, 상관성이 발견되면 가설 검정 단계로 넘어간다.

– 탐색 과정은 반복적인(엔번) 시도를 통해 상관관계를 찾는 과정이며, 한 번에 결과를 얻기는 어렵다.

– 가설 검정 단계에서는 상관 계수가 평가 항목으로 사용될 수 있으며, 이는 탐색 과정의 결과를 검증하는 단계이다.

귀무가설 검증의 어려움

– 귀무가설을 증명하는 어려움에 대한 논의가 제기됨.

– 일반적인 사고방식에서 벗어나 귀무가설을 반박하는 방식을 사용하는 것에 대한 설명이 포함됨.

– p값, 상관계수 등 통계 개념과 관련된 어려움과 대학교 수업과의 비교 언급.

통계학 학습의 어려움과 개선 방안 모색

– 귀납법을 이용한 가설 설정 및 검증 과정의 어려움을 설명하고 있다.

– 주사위 예시 등 추상적인 사례로 인해 실제 적용에 대한 이해도가 낮다는 점을 지적한다.

– 보다 시각적이고 직관적인 설명, 특히 그림이나 도식을 활용한 설명 방식의 필요성을 제기한다.

데이터 분석 목적 설정의 중요성

– 데이터 분석 목적을 명확히 하는 것이 중요하며, 원인 파악이 목적이 아님을 강조.

– 분석 목적을 설정한 후 데이터 분석을 진행해야 함을 제시.

– 매출 감소와 같은 현상에 대해 여러 요인을 고려하고 가설을 세우는 접근 방식을 제안.

데이터 분석 스토리텔링의 이해와 활용

– 매출 감소 원인 분석 과정에서 기후 가설이 도출된 과정을 설명하고, 데이터 분석을 통해 원인과 결과를 도출하는 과정의 어려움을 언급한다.

– 데이터 스토리텔링 연습을 위한 책과 실습 사이트를 소개하며, 데이터 분석 결과를 스토리로 연결하는 방법을 제시한다.

– 데이터 스토리텔링 관련 세미나 또는 워크숍 개최 가능성을 논의하며, 관련 도서의 가격과 두께를 언급한다.

데이터 시각화의 중요성과 어려움

– 데이터 시각화의 필요성을 강조하며, 발표 시 시각 자료 활용의 어려움을 언급.

– 구글 스프레드시트 활용 등 간단한 시각화 방법 제시와 더불어, 대기업에서도 부족한 시각화 프로그램 사용 현황을 지적.

– 세일즈 데이터 분석 프로그램의 한계로 인해 원하는 데이터 추출 및 분석의 어려움, 수기 작업의 불편함을 설명.

데이터 시각화와 산점도 분석

– 크롤링의 용이성을 언급하며, 두 번째 책의 마무리와 10분 강의에 대한 논의가 있었다.

– 아동 교통사고 데이터를 활용한 산점도 분석 사례가 제시되었으며, 도로 환경과 아동의 이동 경로 간의 상관관계 분석이 포함되었다.

– 산점도의 기본 구조와 가로축, 세로축의 변화에 따른 데이터 해석 방법이 설명되었다.

주택 가격과 교통사고 발생 건수의 상관관계 분석

– 주택 가격이 높은 지역일수록 교통사고 발생 건수가 낮은 경향이 있다.

– 강남구, 서초구와 같이 주택 가격이 높은 지역의 사고 발생 건수가 낮았고, 반대로 가격이 상대적으로 낮은 지역의 사고 발생 건수가 높았다.

– 골목길이 많은 지역에서는 교통사고 위험이 높아 이어폰 착용 등 안전에 유의해야 한다는 의견이 제시되었다.

어린이 교통사고와 도시 인프라 개선 필요성

– 어린이 교통사고 이후, 어린이들의 무단횡단에 대한 비판적 여론이 있었으나, 이는 도로 및 인프라 문제로 인한 시야 확보 어려움 때문이라고 지적.

– 아파트 매매가격과 연관하여 인도와 도로의 구분, 놀이터 시설 등 어린이 안전과 관련된 도시 인프라의 질적 차이를 언급.

– 단순 사고 기사가 아닌, 데이터 기반의 스토리텔링을 통해 문제의 본질에 대한 심층적인 논의가 필요함을 강조.

데이터 시각화의 현실: 막대그래프의 지배

– 실무에서는 막대그래프나 선 그래프가 주로 사용된다.

– 다양한 그래프(산점도, 박스 플롯 등) 활용을 원하지만, 상사들은 직관적인 막대그래프를 선호한다.

– 정확한 데이터 해석보다 상사가 원하는 해석을 제시하는 것이 중요하게 여겨진다.

데이터 활용의 현황과 과제

– 데이터 분석의 중요성에도 불구하고, 실제 활용은 기대에 미치지 못하는 경우가 많다.

– 대기업에서는 데이터 분석가가 소수이고, 의사결정은 주로 경영진의 직관에 의존하는 경향이 있다.

– 스타트업은 데이터 기반 의사결정이 더 활발할 것으로 예상되지만, 데이터 세팅 미흡 등의 문제점도 존재한다.

소득 수준과 주거 환경의 상관관계 분석

– 데이터 분석을 통해 소득 수준과 아이들의 성장 환경, 특히 주거 환경의 상관관계를 분석하는 주제가 제시됨.

– 소득 수준에 따라 주거 환경(아파트 단지 시설, 위치 등)의 차이가 크며, 이는 아이들의 성장에 영향을 미침.

– 다양한 지역(한남동, 은평구, 관악구, 금천구 등)의 주거 환경 차이를 비교 분석하여 결과 도출 예상.

다음 모임 책 선정 과정

– 다음 모임을 위한 3가지 책 후보가 제시됨.

– 후보 책들은 인공지능, 윤리, 그리고 AI 비즈니스 관련 내용을 다룸.

– 참석자들의 의견을 수렴하여 최종적으로 읽을 책을 결정할 예정임.

산업별 기술 트렌드 분석 및 미래 전망

– 산업별로 분류된 엑셀 데이터 분석을 통한 기술 트렌드 분석.

– 2020년 출판된 ‘AI와의 경제’ 도서를 참고하여 인공지능 발전에 따른 일자리 및 복지 변화 전망.

– 인공지능 윤리 관련 도서 분석을 통해 AI의 도덕적 측면 고찰.

자율주행차 책임 소재 논쟁과 AI 윤리

– 자율주행차 사고 책임 소재에 대한 질문이 제기됨.

– 최근 테슬라 자율주행차 사고 사례 언급, 도로 상황과 사고 원인에 대한 논란 발생.

– 자율주행차의 윤리적 문제와 경제적 측면을 고려한 책 선정 논의 진행.

AI 윤리 개발의 어려움과 해결 방안 모색

– AI 개발 과정에서 윤리적 문제 준수의 어려움과 기업의 부담에 대한 논의

– 윤리적인 AI 개발을 위한 데이터셋 구축의 어려움과 시장 경쟁력 확보의 필요성 제기

– AI가 가치 판단을 하는 것의 어려움과 이를 해결하기 위한 방어 모델 개발의 중요성 강조

SSENSSEN

2025-02-19삭제

산점도 활용. 시사인. 스쿨존 너머 https://beyondschoolzone.sisain.co.kr/

켄타켄타

2025-02-19삭제

데이터 스토리텔링 연습 – https://www.yes24.com/product/goods/102361090

켄타켄타

2025-02-19삭제

지한 – 4.5/5 데이터를 어떻게 시작해야하나 고민이 많았는데 데이터문해력이라는 책을 처음으로 읽어서 다행인 거 같다. 하지만 내용이 조금 어려웠고 예제가 비슷해서 아쉬웠다.

켄타켄타

2025-02-19삭제

SSEN – 4/5 제목 참 잘 지었다. 데이터 분석을 과하게만 생각하고 있는 사람들에게는 방향타 같은 책. 개인적으로 산점도 분석이 마음에 들었음.

켄타켄타

2025-02-19삭제

켄타 – 3.7/5, 데이터 분석에서 전체적인 프로세스를 알 수 있어 좋았으나 혼자 따라해볼 수 있을까
라는 의문이 남은 책, 용어의 선택이 좋았음

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다