본문 바로가기

728x90
반응형

전체 글

[논문리뷰]Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning 문제인식 최근 관심을 받고 있는 few-shot learning은 각 클래스별 제한된 수의 데이터만으로 분류기를 잘 일반화 하는 것이다. 관련하여 다수의 다중 클래스 데이터로 학습하고 일반화하는 meta-learnig이 많이 사용되고 있지만 여전히 최신의 분류 문제에는 데이터가 적은 문제가 남아있다. 본 연구에서 제안하는 것은 전도성 전파망(Transductive Propagation Network, TPN)을 이용해 전체 데이터를 추론에 이용하는 meta-learning을 제안한다. 배경 개념 Few-shot learning 용어 정리 N-way K-shot way : Class 개수 shot : class당 제공하는 입력 데이터의 수 대부분의 연구들이 5-way 1-shot / 5-way 5-shot.. 더보기
[Programmers] 기능개발 문제 https://school.programmers.co.kr/learn/courses/30/lessons/42586 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 풀이과정 작업의 남은 기간을 (100-작업 진행상태)에서 속도로 나눈 값의 올림으로 계산할 수 있다. 남은 기간 배열에서 본인보다 작은 값에 대해서는 동일한 날짜에 배포가 되므로, 본인보다 큰 값이 나오기 전까지의 수를 카운트 한다. Script import math def solution(progresses, speeds): remain = [math.ceil((100-p)/s) for p.. 더보기
[Programmers] 포켓몬 문제 https://school.programmers.co.kr/learn/courses/30/lessons/1845 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 아이디어 선택할 수 있는 개수인 N/2가 포켓몬 종류(k)보다 적으면 최대 가질 수 있는 종류의 갯수는 N/2. N/2보다 포켓몬 종류가 적으면 최대 가질 수 있는 종류는 k. Script def solution(nums): s = len(nums) // 2 k = len(set(nums)) answer = s if k >= s else k return answer 더보기
[논문리뷰] FixMatch : Simplifying Semi-Supervised Learning with Consistency and Confidence 작년 KAMP 경진대회를 준비하며 라벨 데이터가 적은 한계를 극복하기 위한 Semi-supervised Learning(이하 SSL)에 관심이 생겼다. 관련하여 어떤 논문을 리뷰할까 서치하다 FixMatch라는 구글에서 발표한 연구를 알게 되었다. 최근 딥러닝 업계에서 많이 연구되는 SSL분야는 연구가 많이 진행될수록 모델의 성능이 좋아졌지만 그와 함께 모델의 구조 및 학습 방법 또한 복잡해졌다. FixMatch는 이전에 진행된 최신 SSL 모델 대비 비슷하거나 더 좋은 성능을 가지지만 모델을 단순화 하고 비용을 줄임으로 많은 각광을 받았다는 점이 흥미를 끌었다. 문제 인식 컴퓨터 비젼에 딥러닝을 사용하며 점점 더 많은 데이터가 필요하게 되었다. 하지만 데이터에 라벨을 붙이는 것은 비용과 공수가 많이 드.. 더보기
벡터 벡터란? 숫자를 원소로 가지는 리스트 또는 배열 $$ x = \begin{bmatrix}x_{1}\\x_{2}\\...\\x_{d}\\ \end{bmatrix} $$ $$x^{T} = \begin{bmatrix}x_{1}&x_{2}&...\\ \end{bmatrix}$$ 공간에서의 한 점 원점에서부터의상태적 위치 벡터 연산 같은 모양을 가지면 벡터 간의 덧셈, 뺄셈, 성분곱(Hadamard product) 계산 가능 놈 (norm) : 원점으로부터의 거리 기호 : || . || 임의의 차원 d에 대해 성립 -> 차원 상관없이 계산이 가능 종류 L1 norm $$||x||_{1}=\sum_{i=1}^{d}|x_{i}|$$ 각 성분의 변화량의 절댓값의 합 좌표평면에서 좌표축을 따라 움직이는 거리를 뜻함 L2.. 더보기
Skewness, 비대칭 데이터 머신러닝 프로젝트를 진행할 때 정규 분포가 아닌 꼬리가 한쪽으로 긴 비대칭 데이터를 자주 볼 수 있다. 비대칭 데이터를 정규 분포로 변환해야 모델의 성능이 올라가거나 예측 오차가 줄어든다는 글을 많이 보았는데 이 데이터의 형태는 어떤 것인지, 꼭 변환을 해야 할지 정리해보고자 한다. 왜도(skewness)란 무엇일까? 왜도(skewness)란 한마디로 데이터 분포의 비대칭성의 정도를 뜻한다. 분포는 오른쪽 꼬리가 길거나(skewness > 0), 왼쪽 꼬리가 길거나(skewness < 0) 또는 0의 수치를 가질 수 있다. 아마 다음과 같은 경우에 왜도를 계산할것이다. 해당 변수에 대해 설명하고자 할 때. 해당 변수가 정규 분포인지 확인하고자 할 때. 정규 분포의 왜도 값은 0으로써 많은 통계적 절차들이.. 더보기
Black을 이용한 코드 스타일 맞추기 분석가들의 python 코드 스타일은 정말 제각각이다. linting이나 코드 스타일을 맞추는 것에 신경 쓰고 있지 않았는데 제품에 올리고 협업을 하며 코드 스타 일을 맞추는 것의 필요성을 느꼈다. 오늘은 코드 스타일을 자동으로 포매팅해주는 Black을 알아보고자 한다. https://github.com/psf/black GitHub - psf/black: The uncompromising Python code formatter The uncompromising Python code formatter. Contribute to psf/black development by creating an account on GitHub. github.com Black은 "The Uncompromising Code F.. 더보기
[Library] Dask 추가 정보 및 테스트 지난 포스트에 이어 Dask의 추가적인 특징 및 pandas aggregation과 간단히 비교한 내용을 올리고자 한다. [Library] Dask? Spark? 캐글을 진행하며 중용량(?) 데이터(약 16GB ~ 40GB)를 처리하게 되었다. 파일 포맷과 데이터 타입, 값 변환 등의 처리만으로는 부족하다 싶어 대용량 데이터 처리를 위한 도구를 모색하게 되었다. 대 sha-sha-sha.tistory.com 특징 1. 가상 데이터 프레임 pandas dataframe과 비슷한 기능을 제공하지만 모든 데이터가 메모리에 있는 것은 아님 → 하나 이상의 파일 또는 데이터베이스에 존재하는 채로 처리할 수 있는 기능 메모리 크기와 관계 없이 큰 csv 파일을 가상 데이터 프레임으로 로드 또는 비슷한 형식의 여러개.. 더보기

728x90
반응형