일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- deep daiv. week4 팀활동과제
- deep daiv. 2주차 팀 활동 과제
- deep daiv. project_paper
- deep daiv. WIL
- deep daiv. week3 팀활동과제
- Today
- Total
목록분류 전체보기 (25)
OK ROCK
NeRFGaussian SplattingSuGaR
Contents 1. Principle of Image Segmentation 2. Traditional Method 3. Graph Method 4. Mean Shift 5. Interactive Object Segmentation 1. Principle of Image Segmentation 조건 1. 분할된 영역은 서로 겹칠 수 없다. 조건 2. 모든 영역은 전체 입력 영상을 덮어야 한다. 조건 3. 같은 영역에 속한 모든 화소는 비슷한 명암값처럼 비슷한 성질을 가져야 한다.( 이웃한 영역은 서로 다른 성질을 가져야 한다.) Q. 적절한 분할이란? Under segmentation(저분할) : 위에 언급한 조건을 엄격하게 적용한 결과, 분할된 영역의 갯수가 너무 적음 Over segmenation(..
Computer Vision (오일석) Chapter 04 Contents 1. 지역 특징 검출의 기초 2. 이동과 회전에 불변한 특징점 검출 3. 위치 찾기 알고리즘 4. 스케일에 불변한 특징점 검출 3. 위치 찾기(Localiztion) 알고리즘 지금까지 2절에서는 어떤 점(화소)이 ‘특징일 가능성’을 측정하는 과정에 대해 알아봤다. Non Maximum Suppression 왼쪽 그림은 이전의 사슴 사진에서 헤리스 코너 방법을 이용해서 얻은 S맵이다. 진하게 표시된 구역들이 지역 최대점이고, 코너에서 한 점만 큰 값을 갖는 것이 아니라 큰 값이 일정한 범위에 퍼져 있는 문제가 발생한다. 해당 영역에서 퍼져있는 점 들 중에서 한 점만을 선택하는 방법 = 위치 찾기 = Localization 지역 최대..
Computer Vision (오일석) Chapter 04 Contents 1. 지역 특징 검출의 기초 2. 이동과 회전에 불변한 특징점 검출 3. 위치 찾기 알고리즘 4. 스케일에 불변한 특징점 검출 1. 지역 특징 검출의 기초 Q. 무엇을 특징점으로 쓸 것인가? 후보 1. Edge → 3장의 Edge detection에서 공부하였다. 하지만, 에지가 갖고 있는 정보는 edge magnitude(에지 강도)와 edge direction(에지 방향)밖에 없기 때문에 특징점에 매칭하기에는 빈약하다. 따라서, 풍부한 정보를 지닌 특징점을 검출하는 새로운 접근 방식이 필요. Local Feature(지역 특징)은 edge에 의존하는 대신, 명암 영상(gray scale)에서 직접 특징점을 검출한다. 기존의 C..
ASR = Automatic Speech Recognition 음성 인식(Speech Recognition) 개요 음성 데이터를 컴퓨터가 해석해 내용을 텍스트 데이터로 전환하는 처리 과정. 즉, STT(Speech to Text)와 의미 상통 최근에는 Seq2Seq방식의 RNN으로 속도와 성능 면에서 좋은 결과를 가져오며, 음성인식에서도 End-to-End 학습 방식의 발전으로 오디오 특징을 입력으로 받아 글자 또는 단어(Text)를 출력으로 하는 단일 함수를 학습한다. 한국어 음성으로 구현된 STT 모델이 있는지 여부를 고려했는데, 대부분 오픈소스 STT 모델들은 그 성능이 영어에 한정해서 알려져 있었기 때문에, 한국어 음성에 대해서도 검증된 사례가 있는지 여부가 중요했다. 한국어로 pre-traine..
Tave 동아리에서 진행하고 있는 컴퓨터비전 스터디 - 중요내용만 발췌하여 개인 블로그에 저장하는 용도로 진행 ► 스터디 목차디지털 영상이란?히스토그램이진 영상영상 처리의 세 가지 기본 연산다해상도모폴로지컬러1-1. 디지털 영상이란?1-2. 히스토그램히스토그램은 명암값이 나타난 빈도수를 의미한다. 히스토그램의 용도영상의 특성을 파악하는 것조작을 통한 영상 품질 개선 목적→ 하지만, 분별력없이 사용할 경우 품질 개선이 안될 수도 있다. ( 분별력을 가지고 활용여부 결정)→ 평활화를 진행함으로써 명암값의 범위를 넓혀 선명한 이미지를 얻는다.히스토그램 역투영과 얼굴 검출 히스토그램 역투영은 물체의 모양은 무시하고 단순히 컬러 분포만으로 검출하는 방법이다. 사용 이유 : 1차원이 아닌 2차원 채널을 사용해야 함..
Abstract BART : Bidirectional Auto-Regressive Transformer seq2seq모델의 사전학습 태스크에 쓰이는 노이즈 제거 오토인코더 (denoising autoencoder) noise가 첨가된 텍스트로 , 원래의 텍스트를 복원하는 것을 학습한다. BERT와 GPT를 하나로 합친 형태로, 기존 Seq2seq 트랜스포머 모델을 새로운 pre-training objective을 통해 학습하여 하나로 합친 모델 Introduction Self-supervised learning(자기지도학습)은 NLP에서 주목할만한 성과를 보여주고 있음 MAE(Masked Auto-Encoder)는 문장 내에서 존재하는 단어를 마스킹하여 가려진 텍스트를 다시 재복원(reconstructi..
사투리 인식 및 표준어 변환 음성모델 워크플로우 = [ 사투리(Speech) → Audio Recognition → Text(사투리-표준어 출력) → TTS → 표준어(Speech) ] AI-hub에 있는 경상도 방언발화 데이터 이용 샘플 텍스트 데이터만 잠깐 봤는데 생각보다 표준어(standard form)랑 사투리(dialect form)랑 어휘 면에서 큰 차이가 없는 것 같다는 생각이 든다. 거의 비슷한데 아래 저런 차이정도? 오디오로 함께 들으면 억양차이가 느껴지겠지만 어휘에서도 차이가 큰 사투리 데이터를 사용하는게 좀 더 극적인 효과가 날 것 같긴 해서,, 지역 면에서 제주도 데이터도 고려해보는 것이 나쁘지 않겠다는 생각이 듦 사투리 텍스트를 우선 표준어 텍스트로 번역해주는 NLP 생성 모델 구..
Abstract TTS(Text-To-Speech)에는 여러 도메인의 지식이 필요한 복잡한 분야임 Text Analysis(텍스트 분석) Acoustic model Audio Synthesis module(음성 합성 모듈) Tacotron은 텍스트로부터 바로 발화를 합성하여 생성하는 end-to-end방식의 TTS생성 모델임 sequence-to-sequence를 수행하기 위한 몇가지 주요 기술을 제시함 Introduction 통합된 end-to-end TTS시스템의 장점들은 다음과 같다. 쌍의 데이터로만 학습하기 때문에 인간의 주석처리같은 노동적인 feature engineering작업을 최소화함 발화자와 단어의 더 높은 수준의 feature와 특성을 반영할 수 있음 단일 모델만으로 multi-stag..
[ Excel ] weekday(날짜형식, 옵션) : 지정한 날짜의 요일 값을 숫자로 반환 옵션 2 = 월(1), 화(2), ..., 일(7) 옵션 1 = 일(1), 월(2), ... 옵션 3 = 월(0), 화(1), ... switch(조건1, 값1, 조건2, 값2, ..) 액셀의 조건부 서식에서 수식 작성할 때는 등호와 []기호 사용하고 필드명 사용하는 것이 아니라 셀의 주소를 참조하여 수식 작성해야 함 고급 필터에서 일반식 말고 논리식으로 조건 설정하면 조건명을 필드명과 다르게 설정해야 하고 셀 주소 첫번째 행이 참조되었는지 확인 사용자 지정 서식 형태 1 = [조건1]서식 ; [조건2]서식 ; 그 외 숫자 서식 ; 문자일 때 서식 사용자 지정 서식 형태 2 = 양수일 때 서식; 음수일 때 서식; ..