본문 바로가기

카테고리 없음

DataScientist 마인드셋 특강

지난번 김용담님의 특강 요약으로 시작....

1 AI Engineer Mindset 특강

김용담 강사님의 특강 : 서강대학교 컴퓨터공학 학사, 머신러닝 석사

ML 전문 강사답게 지식이 풍부하다는 걸 느꼈다.

 

[부트캠프에서 살아남는 법]

  • 공부는 내가 하는 거다
  • 생각보다 건강이 중요하다
  • 생각보다 훨씬 할게 많다
  • 떠먹여주긴하는데 씹고 삼키고 소화하는게 생각보다 힘들다
  • 누군가 나보다 잘한다면, 재능 차이보단 이미 공부하고 온 사람이다
  • 생각보다 많이 싸운다

 

정해진 기본 특강을 마치고, 수강생들이 궁금해 하는 점을 막힘없이 모두 설명해 주셨다. 최고에요!

 

[당부]
비전공 - 목숨을 걸고 파이썬 프로그래밍을 공부해라. 파이썬 못하면 과정을 포기한다.
전공자 - 파이썬 학습기간에 스터디를 하거나 개인적으로 경진대회를 참여해라.

 

2. 두번째 특강

 

박기준 LM 마인드셋 특강은 아래와 같이 진행되었다.

 

1) 부트캠프 활동 내용 공유

2) AI 부트캠프 VS Upstage AI Lab

3) 프로젝트 어떻게 진행하나요?

4) Q&A

 

 

1) 부트캠프 활동 내용 공유
- Toy프로젝트:웹크롤링
=> 결과물에 신경쓰자

- EDA 프로젝트: 리그오브레전드 프로선수들의 노화곡선(aging-curve) 판별
=> 압도적인 이상치 처리 

- 모델링 : Kaggle 경진대회 - Regression with a Tabular Media Campaign Cost Dataset
=> 342/954(상위 36%)
=> stacking 과도하게(오버피팅)
=> 친구를 얻음.


- 파이널 프로젝트 : Smart Inside AI
YOLOv8을 이용한 서비스 개발
1. 해양 쓰레기 감지 서비스
2. 구명조끼 미착용자 감지 서비스

YOLOv8 튜토리얼만으로도 이용 가능


2) AI 부트캠프 VS Upstage AI Lab
파이썬 : 기존 3주 vs 2일
upstage와 비해 엄청 좁고 엄청 얇다

upstage 장점:CV->생성형 AI, LLM, 추천시스템
* AI 중급자 과정
* EDA만 자유주제
* 7개 트랙
* 경진대회 : ai stages
=> 문제 제작자 리뷰 *****

=> 경진대회 이후 리포트 가이드 확인 후 방법론, 소통, 회고를 정리해라.

* 경진 대회의 부족함을 커버 => 그룹스터디(규칙, 기록, 사이드 프로젝트 진행-캐글, 데이콘) 2~6명 추천


3) 프로젝트 어떻게 진행하나요?
절차~~~, 힌트, 팁

파이썬 프로젝트 : 난이도 쉬울 듯..., 협업에 집중..
- 팀편성 - 전체 랜덤
- 강사 OT진행
- 강사 팀별 순회 피드백
- 결과 제출/발표회

EDA 프로젝트: 반드시 대시보드까지..., 의료 논문까지 준비한 팀이 있음., 어려운 주제나 데이터가 없는 주제는 선택하지 말라
- 사전 주제 조사 진행 - 대주제
- 주제에 따른 팀 편성 진행
- 강사 OT진행
- 강사 팀별 순회 피드백
- 결과 제출/발표회

Machine Learning 프로젝트 : 팀명, 개인이름 재미있게 설정하기...
- 주제에 따른 팀 편성 진행
- 강사 OT진행
- 강사 팀별 순회 피드백
- 결과 제출/발표회
=> 수상을 원하면 자신있는 주제로..., 경험을 원하면 생소한 도메인, 캐글이 처음이라면 submission 연습부터


ML 경진대회 : 데이터 전처리 + 파생변수가 핵심
- 팀편성 - 사전구성, 운영진 평가, 랜덤
- Upstage 강사님 VOD OT
- 강사 팀별 순회 피드백
- 팀별 담당 멘토의 실시간&서면 멘토링 진행
- 결과 제출 및 세미나 진행
=> 꼴찌부터 발표

CV 경진 대회 : OCR에 집착하지 않는 것이 핵심.
- 팀편성 - 사전구성, 운영진 평가, 랜덤
- Upstage 강사님 VOD OT
- 강사 팀별 순회 피드백
- 팀별 담당 멘토의 실시간&서면 멘토링 진행
- 결과 제출 및 세미나 진행

NLP 경진대회 : 데이터 전처리가 중요 + 다양한 모델
- 팀편성 - 사전구성, 운영진 평가, 랜덤
- Upstage 강사님 VOD OT
- 강사 팀별 순회 피드백
- 팀별 담당 멘토의 실시간&서면 멘토링 진행
- 결과 제출 및 세미나 진행

AI 심화학습 경진대회 : OCR, Information Retrieval, RecSys Basic, Anomaly Detection
- 각 트랙별 선호도 조사 지행
- 선호도 조사 기반 팀편성 - 사전구성, 운영진 평가, 랜덤
- 강사 팀별 순회 피드백
- 팀별 담당 멘토의 실시간&서면 멘토링 진행
- 결과 제출 및 세미나 진행
=> 합을 맞춘 팀원들이 두팀으로 나누어 대회 참여해보는 것도 좋음.

4) Q&A

 

 

부트캠프의 전체적인 흐름을 알게 되었고, 다시 한번 마음을 다잡게 되었다.

 

 

세번째 특강

김남혁님의 특강

 

주제 : 슬기로운 부캠생활

 

- 전공 : 수학 전공
=> 수학을 하다보니 좋아했던 것은 산수였다.
=> 경제금융학부 복수전공->금융권 취업 준비
=> 데이터 분석가 직업이 유행 -> 코딩 공부 시작
=> 데이터 분석에서 인공지능으로 유행이 바뀜에 따라
=> 네이버 boostcamp ai tech 1기, 구글 ml 부트캠프

=> 첫 직장 업스테이지 : 데이터 매니져

Data Manager
- 인공지능에 필요한 데이터 관련된 모든 업무를 수행
● 학습 데이터 구축 ( 수집, 라벨링, 규칙, 품질 … )
● 평가 데이터 구축 ( 샘플링, 기준, 점수 … )
● 데이터 구축에 필요한 라이브러리 개발 ( 전처리, 후처리, 자동화 … )
● 데이터 구축에 필요한 툴 개발 (수집 툴, 라벨링 툴, 관리 툴 …)

 

따라서 데이터 매니저는 인공지능 + 개발 + 데이터(도메인)에 대한 지식을 골고루 갖추고 있어야 함

 

부캠 장단점

 

장점
● 밀도 높은 수강 기간 (짧고 굵게!)
● 탄탄한 커리큘럼
● 네트워크의 확장 (동기, 강사 등)
● 이력서 한 줄 추가
● 다양한 포트폴리오 제작
● 커리어 전환의 기회

 

단점
● 너무나도 높은 밀도 (거의 올인)
● 길다면 길지만, 짧다면 짧은 기간
● 수강생들 간의 실력 차이가 존재
● 모두가 동일한 커리큘럼을 배우기 때문에,
차별성을 갖기 어려움

 

* 6~7개월이라는 기간이 절대 짧지는 않기에, 너무 급하지도 너무 느리지도 않게 그냥 꾸준히!

기본 중의 기본은 커리큘럼을 잘 따라가는 것!

 

[마음가짐]
열정만 있으면 안 되는게 없다. 열정 뿜뿜!

 

어떻게 하면 포트폴리오의 퀄리티를 높일 수 있을지에 초점 - 취업
=> SOTA(State Of The Art)모델 구현, 데모페이지 구축 등 표현

 

 

* 중요한 건 꺾이지 않는 마음 *
* 중요한 건 꺾였는데도 그냥 하는 마음

 

 

요약 : 제일 중요한 건 꾸준히 포기하지 않고 학습하고, CS기초를 튼튼히 할것.