본문 바로가기

728x90
반응형

Analysis

[그래프] 2-2. 그래프 패턴 이전 포스트에 계속되는 내용입니다 2022.09.27 - [Analysis] - [그래프] 2-1. 그래프 패턴 [그래프] 2-1. 그래프 패턴 1. 실제 그래프 VS 랜덤 그래프 실제 그래프(Real Graph)란 다양한 복잡계로부터 얻어진 그래프 소셜 네트워크, 전자 상거래 구매 내역, 인터넷, 웹 그래프.. 랜덤 그래프 (Random Graph)란 확률적 과정을 sha-sha-sha.tistory.com 4. 거대 연결 요소 필수 개념 : 연결 요소 (Connected Component) 다음 조건들을 만족하는 정점들의 집합 연결 요소에 속하는 정점들은 경로로 연결될 수 있음 1의 조건을 만족하면서 정점을 추가할 수 없음 예시 좌측 그래프에는 3개의 연결 요소가 존재 {1, 2, 3, 4, 5}, .. 더보기
[그래프] 2-1. 그래프 패턴 1. 실제 그래프 VS 랜덤 그래프 실제 그래프(Real Graph)란 다양한 복잡계로부터 얻어진 그래프 소셜 네트워크, 전자 상거래 구매 내역, 인터넷, 웹 그래프.. 랜덤 그래프 (Random Graph)란 확률적 과정을 통해 생성한 그래프 ex: 에르되스-레니 랜덤 그래프 (Erdos-Renyi Random Graph) 임의의 두 정점 사이에 간선이 존재하는지 여부는 동일한 확률 분포에 의해 결정됨 G(n, p) n개의 정점 임의의 두 정점 사이에 간선이 존재할 확률은 p 정점 간의 연결은 서로 독립적(Independent) Q : G(3, 0.3)에 의해 생성될 수 있는 그래프와 각각의 확률은? 정점 3개, 간선이 존재할 확률 0.3 ( = 간선이 존재하기 않을 확률 0.7) $0.3^3$ $0... 더보기
[그래프] 1-2. 필수 기초 개념 1. 그래프 유형 및 분류 방향의 유무 간선에 방향이 없는 그래프 (Undirected Graph) 간선에 방향이 있는 그래프 (Directed Graph) 협업 관계 그래프 페이스북 친구 그래프 인용 그래프 트위터 팔로우 그래프 가중치의 유무 간선에 가중치가 없는 그래프 (Unweighted Graph) 간선에 가중치가 있는 그래프 (Weighted Graph) 웹 그래프 페이스북 친구 그래프 전화 그래프(횟수 등) 유사도 그래프 정점의 종류 동종 그래프 - 단일 종류의 정점 (Unpartite Graph) 이종 그래프 - 두 종류의 정점 (Bipartite Graph) 웹 그래프 페이스북 친구 그래프 전자 상거래 구매 내역 (사용자, 상품) 영화 출연 그래프 (배우, 영화) 2. 필수 기초 개념 그래.. 더보기
[그래프] 1-1. 그래프 이론기초 1. 그래프란 무엇이고 왜 중요할까? 그래프의 정의 및 구성요소 그래프(Graph)는 정점 집합과 간선 집합으로 이루어진 수학적 구조. 네트워크(Network)라고도 불림 하나의 간선은 두 개의 정점을 연결. 모든 정점 쌍이 반드시 간선으로 직접 연결되는 것은 아님. 그래프는 왜 중요할까? 우리 주변의 많은 관계와 시스템은 복잡계(Complex System)로 구성됨. ex : 70억 인구로 구성된 사회, 전자 장치로 구성된 통신 시스템, 정보와 지식, 뇌, 신체 등. 공통 특징 : 구성 요소 간의 복잡한 상호작용 표현 방법 : 그래프 (= 복잡계를 표현하고 분석하기 위한 언어) 활용 분야 : 전산학, 물리학, 화학, 사회과학 → 뇌(뉴런 간 연결), 지식 그래프, 화학 분자, 단백질 구조, 세포 간 유.. 더보기
[논문리뷰]Learning to Propagate Labels: Transductive Propagation Network for Few-shot Learning 문제인식 최근 관심을 받고 있는 few-shot learning은 각 클래스별 제한된 수의 데이터만으로 분류기를 잘 일반화 하는 것이다. 관련하여 다수의 다중 클래스 데이터로 학습하고 일반화하는 meta-learnig이 많이 사용되고 있지만 여전히 최신의 분류 문제에는 데이터가 적은 문제가 남아있다. 본 연구에서 제안하는 것은 전도성 전파망(Transductive Propagation Network, TPN)을 이용해 전체 데이터를 추론에 이용하는 meta-learning을 제안한다. 배경 개념 Few-shot learning 용어 정리 N-way K-shot way : Class 개수 shot : class당 제공하는 입력 데이터의 수 대부분의 연구들이 5-way 1-shot / 5-way 5-shot.. 더보기
[논문리뷰] FixMatch : Simplifying Semi-Supervised Learning with Consistency and Confidence 작년 KAMP 경진대회를 준비하며 라벨 데이터가 적은 한계를 극복하기 위한 Semi-supervised Learning(이하 SSL)에 관심이 생겼다. 관련하여 어떤 논문을 리뷰할까 서치하다 FixMatch라는 구글에서 발표한 연구를 알게 되었다. 최근 딥러닝 업계에서 많이 연구되는 SSL분야는 연구가 많이 진행될수록 모델의 성능이 좋아졌지만 그와 함께 모델의 구조 및 학습 방법 또한 복잡해졌다. FixMatch는 이전에 진행된 최신 SSL 모델 대비 비슷하거나 더 좋은 성능을 가지지만 모델을 단순화 하고 비용을 줄임으로 많은 각광을 받았다는 점이 흥미를 끌었다. 문제 인식 컴퓨터 비젼에 딥러닝을 사용하며 점점 더 많은 데이터가 필요하게 되었다. 하지만 데이터에 라벨을 붙이는 것은 비용과 공수가 많이 드.. 더보기
벡터 벡터란? 숫자를 원소로 가지는 리스트 또는 배열 $$ x = \begin{bmatrix}x_{1}\\x_{2}\\...\\x_{d}\\ \end{bmatrix} $$ $$x^{T} = \begin{bmatrix}x_{1}&x_{2}&...\\ \end{bmatrix}$$ 공간에서의 한 점 원점에서부터의상태적 위치 벡터 연산 같은 모양을 가지면 벡터 간의 덧셈, 뺄셈, 성분곱(Hadamard product) 계산 가능 놈 (norm) : 원점으로부터의 거리 기호 : || . || 임의의 차원 d에 대해 성립 -> 차원 상관없이 계산이 가능 종류 L1 norm $$||x||_{1}=\sum_{i=1}^{d}|x_{i}|$$ 각 성분의 변화량의 절댓값의 합 좌표평면에서 좌표축을 따라 움직이는 거리를 뜻함 L2.. 더보기
Skewness, 비대칭 데이터 머신러닝 프로젝트를 진행할 때 정규 분포가 아닌 꼬리가 한쪽으로 긴 비대칭 데이터를 자주 볼 수 있다. 비대칭 데이터를 정규 분포로 변환해야 모델의 성능이 올라가거나 예측 오차가 줄어든다는 글을 많이 보았는데 이 데이터의 형태는 어떤 것인지, 꼭 변환을 해야 할지 정리해보고자 한다. 왜도(skewness)란 무엇일까? 왜도(skewness)란 한마디로 데이터 분포의 비대칭성의 정도를 뜻한다. 분포는 오른쪽 꼬리가 길거나(skewness > 0), 왼쪽 꼬리가 길거나(skewness < 0) 또는 0의 수치를 가질 수 있다. 아마 다음과 같은 경우에 왜도를 계산할것이다. 해당 변수에 대해 설명하고자 할 때. 해당 변수가 정규 분포인지 확인하고자 할 때. 정규 분포의 왜도 값은 0으로써 많은 통계적 절차들이.. 더보기

728x90
반응형