본문 바로가기

전체 글

(18)
Upstage AI Lab 3기 - 부스트커리어 - 코딩테스트 커리어서비스 (10.28 ~ 11.08) 진행아래 2가지가 주요 활동이다. 1)입사지원서류 검토 상담 2)코딩테스트 준비 000 멘토님이 하루에 두 문제씩 제안을 하고 수강생이 풀어보는 방식이다. 1주일에 한번은 그 중 2문제를 골라 풀이를 Notion에 설명해 주신다. 피로도문제 설명XX게임에는 피로도 시스템(0 이상의 정수로 표현합니다)이 있으며, 일정 피로도를 사용해서 던전을 탐험할 수 있습니다. 이때, 각 던전마다 탐험을 시작하기 위해 필요한 "최소 필요 피로도"와 던전 탐험을 마쳤을 때 소모되는 "소모 피로도"가 있습니다. "최소 필요 피로도"는 해당 던전을 탐험하기 위해 가지고 있어야 하는 최소한의 피로도를 나타내며, "소모 피로도"는 던전을 탐험한 후 소모되는 피로도를 나타냅니다. 예를 들어..
Upstage AI Lab 3기 - IR 프로젝트 테스트 내용 정리 보호되어 있는 글입니다.
Upstage AI Lab 3기 - Data Centric AI ▣ 목차 ▣  1. Data-Centric AI란? (1-1) Data-Centric AI란 (1-2) Data-Centric AI의 미래 2. 데이터 기획 (2-1) 데이터 구축 프로세스 소개 (2-2) 데이터 구축 기획서 작성 3. 데이터 수집 (3-1) 직접수집 (3-2) 크롤링 (3-3) 오픈소스 (3-4) 크라우드 소싱 (3-5) 데이터 수집시 주의 사항 - 라이선스, 개인정보보호, 윤리 (3-6) 데이터 전처리 4. 데이터 라벨링 (4-1) 라벨링 가이드라인 작성 방법 (4-2) 데이터 라벨링 규칙 설정 1 _ CV (4-3) 데이터 라벨링 규칙 설정 2 _ NLP (4-4) 라벨링 툴 소개 5. 데이터 클렌징 (5-1) 데이터 클렌징 (5-2) 데이터 평가 방법 _ IAA (5-3) IAA를..
Upstage AI Lab 3기 - Natural Language Processing Basic, Advanced, 경진대회, LM to LLM NLP 학습과정은 크게 Basic, Advanced, 경진대회, 그리고 LM to LLM으로 이어진다. 학습목표는 아래와 같다. -. 자연언어처리(Natural Language Processing, NLP)에 대한 깊이 있는 이해, 자연어처리 응용 분야와 연구 동향 -. 규칙기반, 통계기반, 기계학습, 딥러닝, Attention 및 Transformer 등 다양한 방법론등의 자연언어처리의 기본적인 개념과 이론을 학습하고 이해하는 것 -. 자연언어처리의 다양한 응용분야와 LLM 등의 최신 연구 동향을 파악, 이를 통해 미래의 자연언어처리 기술 및 응용에 대한 통찰력을 기르는 것 NLP관련 학습내용과 경진대회를 간단히 정리해 보고자 한다. NLP Basic1. 자연언어처리 2. 자연언어처리를 위한 언어학 기..
Upstage AI Lab 3기 - Computer Vision & Generation 목차 1. 컴퓨터 비전이란?2. 컴퓨터 비전 활용 사례3. 컴퓨터 비전 모델 구조 이해하기4. Backbone 이해하기5. Object Detection6. Semantic Segmentation7. Computer Vision Generation1) 생성 모델의 발전 과정 2) 생성 모델과 최대 가능도 추정 3) 오토 인코더와 변분 오토 인코더 4) 적대적 생성 신경망 5) 확산 모델  1. 컴퓨터 비전이란?: 컴퓨터 공학의 한 분야로 컴퓨터로 시각(vision) 데이터를 처리하는 분야 vision : 시각적인 정보들의 집합. :=> 시각으로 보이는 것을 숫자로 데이터화 하여 저장한 모든 것들을 포함하는 개념.   2. 컴퓨터 비전 활용 사례pose estimationOptical Character R..
Upstage AI Lab 3기 - Computer Vision [경진대회] Image Classification CV5팀 : 박석, 백경탁, 한아름, 위효연 CV 프로젝트 개요.▣ 주제 : Document Type Classification | 문서 타입 분류문서는 금융, 보험, 물류, 의료 등 도메인을 가리지 않고 많이 취급됩니다. 이 대회는 다양한 종류의 문서 이미지의 클래스를 예측합니다. 문서 타입 분류를 위한 이미지 분류 대회  문서 데이터는 금융, 의료, 보험, 물류 등 산업 전반에 가장 많은 데이터이며, 많은 대기업에서 디지털 혁신을 위해 문서 유형을 분류하고자 함. 대회에 사용될 데이터는 총 17개 종의 문서로 분류되어 있음.문서 타입 데이터셋을 이용해 이미지 분류를 모델을 구축하고  주어진 문서 이미지를 입력 받아 17개의 클래스 중 정답을 예측하는 대회.▣ 환경Upstage Server VPN 연결..
Upstage AI Lab 3기 - Machine Learning [경진대회] Regression ML3팀 : 박석, 백경탁, 한아름, 이승현 ML 프로젝트 개요.▣ 주제 : House Price Prediction | 아파트 실거래가 예측서울시 아파트 실거래가 매매 데이터를 기반으로 아파트 가격을 예측하는 대회경진대회의 목표는 정확하고 일반화된 모델을 개발하여 아파트 시장의 동향을 미리 예측하는 것▣ 환경Upstage Server VPN 연결하여 사용(GPU사용 가능)▣ 결과물input : 9,272개의 아파트 특징 및 거래정보output : 9,272개의 input에 대한 예상 아파트 거래금액▣ 평가 방법해당 시점의 매매 실거래가를 예측하는 Regression 대회이며, 평가지표는 RMSE(Root Mean Squared Error)를 사용RMSE는 예측된 값과 실제 값 간의 평균편차를 측정 ▣ ..
Upstage AI Lab 3기 - AI 과정 중간 회고 4월에 시작한 부트캠프가 벌써 7월 중반이 되어간다. 과정의 중간을 지나는 시점이다. 처음 AI과정을 신청할 때가 생각난다. 비전공자(?)는 어렵고 힘든 과정이라고 소문이 났었고... 그래서 Upstage AI과정을 지원할까 말까 고민했던 그 때... 3개월 정말 빨리 지나갔다는 생각이 든다. 어찌됐든 과정을 포기하지 않고 버티고 버텨서 여기까지 왔다. 한편으론 잘했다라고 생각이 들다가, 한편으론 내가 성장하고 있나? 의문이 든다. 하나하나 과정들을 돌이켜 본다. 첫번째, 파이썬( + 프로젝트) -기초문법 및 활용 -API, 크롤링 파이썬 기초 문법은 이미 알고 있었으나, 웹크롤링은 처음 접해봤었고, 많이많이 신기했고 관심이 갔던 프로젝트였다. NFT를 주제로 프로젝트를 진행했고, 극악의 난이도인 Ope..